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— SJ^, bStraC !l 11 ! e inventi0 7 elates 10 a method f«- 'he parallel detection of the degree of methylation of genomic DNA wherein 
th e following the steps are performed: (a) chemical treatment a. the 5' position of non-meAylattdiytosine bl^v^ «SS 
m o uraal thymine or another base which exhibits hybridization behavior different to J of cytosine in VZmHA^Z 
(b) more than ten dtfferen, fragments, each having less than 2000 base pairs in said chemically treated genomic DNA 
^amphfiedsimultaneouslyusing synthetic oligonucleotides asaprimer. whereby said primers each contaSS^SSh^ 

S ^) ^ammenfassung: Beschrieben ist ein Verfahren zur parallelen Detektion des Methylierungszustandes von senomischer 
^ d ? m t0 ' h 8 T de SC " riBe aUSfUhrt: (a) in einer S™™*™ DNA Probe wandel. man Jd^S^lSS!^ 

^ Shni-Vhe R r nm ?M erte , Cyt ° S ^ aSen " UraCi1 ' Thymidin <*" dne andere Vom Hybridisierungsverh^n her dem SsS 
© Z 2? H> , 1 ( } f e ^ Chem ' SCh behandelten genomischen DNA amplifiziert man mehr als zehn umerschiedTche fT 
mente, dte jewetls wemger als 2000 Basenpaare lang sind, gleichzei.ig durch Verwendung von synthetische oEuSeodden af 
O Pnmer, wobe, d.ese Pnmer jewei.s Sequenzen aus an der Genregu.auon beteiligten und/oL transkrib S ^^2225 
^ genonuschen Sequenzen enthahen, wie sie nach einer Behandlung gemaB Schritt (a) vorliegen wurden fc^ man 
> quenzkontex, al.er Oder eines Teils der in den amp.ifizierten FragnfeL ^^^^^SS^S£SL 
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Verfahren zur parallelen Detektion des Methylierungszustandes 

von genomischer DNA 

Die vorliegende Erfindung betrifft ein Verfahren zur parallelen Detektion des 
Methylierungszustandes von genomischer DNA. 

Die nach den methodischen Entwicklungen der letzten Jahre in der Molekularbiologie 
gut studierten Beobachtungsebenen sind die Gene selbst, die Ubersetzung dieser 
Gene in RNA und die daraus entstehenden Proteine. Wann im Laufe der Entwicklung 
eines Individuums welches Gen angeschaltet wird und wie Aktivieren und Inhibieren 
bestimmter Gene in bestimmten Zellen und Geweben gesteuert wird, ist mit hoher 
Wahrscheinlichkeit mit Ausmafi und Charakter der Methylierung der Gene bzw. des 
Genoms korrelierbar. Insofern ist die Annahme naheliegend, daR pathogene Zustande 
sich in einem veranderten Methylierungsmuster einzelner Gene oder des Genoms 
au&ern. 

Stand der Technik sind Verfahren, welche das Studium von Methylierungsmustern 
einzelner Gene gestatten. Jungere Fortentwicklungen dieser Methode erlauben auch 
die Analyse kleinster Mengen an Ausgangsmaterial. Die vorliegende Erfindung 
beschreibt ein Verfahren zur parallelen Detektion des Methylierungszustandes 
genomischer DNA Proben, wobei ausgehend von einer Probe gleichzeitig zahlreiche 
verschiedenene Fragmente aus an der Genregulation beteiligten oder/und 
transkribierten und/oder translatierten Sequenzen amplifiziert werden und anschliefcend 
der Sequenzkontext in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide 
untersucht wird. 

5-Methylcytosin ist die haufigste kovalent modifizierte Base in der DNA eukaryotischer 
Zellen. Sie spielt beispielsweise eine Rolle in der Regulation der Transkription, 
genomischem Imprinting und in der Tumorgenese. Die Identifizierung von 5- 
Methylcytosin als Bestandteil genetischer Information ist daher von erheblichem 
Interesse. 5-Methylcytosin-Positionen konnen jedoch nicht durch Sequenzierung 
identifiziert werden, da 5-Methylcytosin das gleiche Basenpaarungsverhalten aufweist 
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wie Cytosin. Daruber hinaus geht bei einer PCR-Amplifikation die epigenetische 
Information, welche die 5-Methylcytosine tragen, vollstandig verloren. 
Die Modifikation der genomischen Base Cytosin zu 5-MethyIcytosin stellt den bis heute 
wichtigsten und best-untersuchten epigenetischen Parameter dar. Trotzdem gibt es bis 
heute zwar Methoden, umfassende Genotypen von Zellen und Individuen zu ermitteln, 
aber noch keine vergleichbaren Ansatze auch in groftem Mafie epigenotypische 
Information zu generieren und auszuwerten. 



Es sind im Prinzip drei prinzipiell verschiedene Methoden bekannt, den 5-Methyl-Status 
eines Cytosins im Sequenzkontext zu bestimmen. 



Die erste prinzipielle Methode beruht auf der Verwendung von Restriktionsendo- 
nukleasen (RE), welche „methylierungssensitiv" sind. REs zeichnen sich dadurch aus, 
daB sie an einer bestimmten DNA-Sequenz, meist zwischen 4 und 8 Basen lang, einen 
Schnitt in die DNA einfiihren. Die Position solcher Schnitte kann dann durch 
Gelektrophorese, Transfer auf eine Membran und Hybridisierung nachgewiesen 
werden. Methylierungssensitiv bedeutet, daG bestimmte Basen innerhalb der 
Erkennungssequenz unmethyliert vorliegen mussen, damit der Schnitt erfolgen kann. 
Das Bandenmuster nach einem Restriktionsschnitt und Gelektrophorese andert sich 
also je nach Methylierungsmuster der DNA. Allerdings befinden sich die wenigsten 
methylierbaren CpG innerhalb von Erkennungssequenzen von REs, konnen also nach 
dieser Methode nicht untersucht werden. 



Die Empfindlichkeit dieser Methoden ist extrem niedrig (Bird, A.P., and Southern, E.M., 
J.Mol. Biol. 118, 27-47). Eine Variante kombiniert PCR mit dieser Methode, eine 
Amplifikation durch zwei auf beiden Seiten der Erkennungssequenz liegende Primer 
erfolgt nach einem Schnitt nur dann, wenn die Erkennungssequenz methyliert vorliegt. 
Die Empfindlichkeit steigt in diesem Fall auf theoretisch ein einziges Molekul der 
Zielsequenz, allerdings konnen mit hohem Aufwand nur einzelne Positionen untersucht 
werden (Shemer, R. et al., PNAS 93, 6371-6376). Wiederum ist Voraussetzung, daG 
sich die methylierbare Position innerhalb der Erkennungssequenz einer RE befindet. 
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Die zweite Variants beruht auf partieller chemischer Spaltung von Gesamt-DNA, nach 
dem Vorbild einer Maxam-Gilbert Sequenzierreaktion, Ligation von Adaptoren an die so 
generierten Enden, Amplifikation mit generischen Primem und Auftrennung auf einer 
Gelektrophorese. Mit diesem Verfahren konnen definierte Bereiche bis zur GroBe von 
weniger als tausend Basenpaaren untersucht werden. Das Verfahren ist allerdings so 
kompliziert und unzuverlassig, daft es praktisch nicht mehr verwendet wird (Ward, C. et 
al., J. Biol. Chem. 265, 3030-3033). 

Eine relativ neue und die mittlerweile am haufigsten angewandte Methode zur 
Untersuchung von DNA auf 5-Methylcytosin beruht auf der spezifischen Reaktion von 
Bisulphit mit Cytosin, das nach anschlieftender alkalischer Hydrolyse in Uracil 
umgewandelt wird, welches in seinem Basen-Paarungsverhalten dem Thymidin 
entspricht 5-Methylcytosin wird dagegen unter diesen Bedingungen nicht modifiziert. 
Damit wird die ursprungliche DNA so umgewandelt, da& Methylcytosin, welches 
ursprunglich durch sein Hybridisierungsverhalten vom Cytosin nicht unterschieden 
werden kann, jetzt durch „normale" molekularbiologische Techniken als einzig 
verbliebenes Cytosin beispielsweise durch Amplifikation und Hybridisierung oder 
Sequenzierung nachgewiesen werden kann. Alle diese Techniken beruhen auf 
Basenpaarung, welche jetzt voll ausgenutzt werden kann. Der Stand der Technik, was 
die Empfindlichkeit betrifft, wird durch ein Verfahren definiert, welches die zu 
untersuchende DNA in einer Agarose-Matrix einschliefct, dadurch die Diffusion und 
Renaturierung der DNA (Bisulphit reagiert nur an einzelstrangiger DNA) verhindert und 
alle Fallungs- und Reinigungsschritte durch schnelle Dialyse ersetzt (Olek, A. et al., 
Nucl. Acids. Res. 24, 5064-5066). Mit dieser Methode konnen einzelne Zellen 
untersucht werden, was das Potential der Methode veranschaulicht. Allerdings werden 
bisher nur einzelne Regionen bis etwa 3000 Basenpaare Lange untersucht, eine 
globale Untersuchung von Zellen auf Tausende von moglichen 
Methylierungsereignissen ist nicht moglich. Allerdings kann auch dieses Verfahren 
keine sehr kleinen Fragmente aus geringen Probenmengen zuverlassig analysieren. 
Diese gehen trotz Diffusionsschutz durch die Matrix verloren. 

Eine Ubersicht uber die weiteren bekannte Moglichkeiten, 5-Methylcytsosine 
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nachzuweisen, kann auch dem folgenden Ubersichtsartikel entnommen werden: Rein, 
T., DePamphilis, M. L, Zorbas, H., Nucleic Acids Res. 26, 2255 (1998). 

Die Bisulphit-Technik wird bisher bis auf wenige Ausnahmen (z.B. Zeschnigk, M. et al., 
Eur. J. Hum. Gen. 5, 94-98; Kubota T. et al.. Nat. Genet. 16, 16-17) nur in der 
Forschung angewendet. Immer aber werden kurze, spezifische Stiicke eines 
bekannten Gens nach einer Bisulphit-Behandlung amplifiziert und entweder komplett 
sequenziert (Olek, A. and Walter, J., Nat. Genet. 17, 275-276) oder einzelne Cytosin- 
Positionen durch eine ..Primer-Extension-Reaktion" (Gonzalgo, M. L. and Jones, P.A., 
Nucl. Acids. Res. 25, 2529-2531) oder Enzymschnitt (Xiong, Z. and Laird, P.W., Nucl. 
Acids. Res. 25, 2532-2534) nachgewiesen. Zudem ist auch der Nachweis durch 
Hybridisierung beschrieben worden (Olek et al, W09928498). 

Gemeinsamkeiten zwischen Promotoren bestehen nicht nur im Vorkommen von TATA- 
oder GC-Boxen sondern auch darin, fur welche Transkriptionsfaktoren sie Bindestellen 
besitzen und in welchem Abstand diese sich zueinander befinden. Die existierenden 
Bindestellen fur ein bestimmtes Protein stimmen in ihrer Sequenz nicht vollstandig 
Dberein, es finden sich aber konservierte Folgen von mindestens 4 Basen, die durch 
das Einfugen von „Wobbles", d. h. Positionen, an denen sich jeweils unterschiedliche 
Basen befinden, noch verlangert werden kdnnen. Des weiteren liegen diese 
Bindestellen in bestimmten Abstanden zueinander vor. 

Die Verteilung der DNA im Interphase-Chromatin, das den grdliten Teil des nuklearen 
Volumens einnimmt, unterliegt jedoch einer ganz speziellen Ordnung. So ist die DNA 
an mehreren Stellen an die nukleare Matrix, eine filamentose Struktur an der Innenseite 
der nuklearen Membran, angeheftet. Diese Regionen, bezeichnet man als matrix 
attachment regions (MAR) oder scaffold attachment regions (SAR). Das Anheften hat 
wesentlichen Einfluft auf die Transkription bzw. die Replikation. Diese MAR-Fragmente 
weisen keine konservativen Sequenzen auf, bestehen allerdings zu 70% aus A bzw. T 
und liegen in der Nahe von cis-agierenden Regionen, die die Transkription allgemein 
regulieren, und Topoisomerase ll-Erkennungsstellen. 
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Neben Promotoren und Enhancern existieren weitere regulatorische Elemente fur 
verschiedene Gene, sogenannte Insulators. Diese Insulators konnen z.B. die Wirkung 
des Enhancers auf den Promotor inhibieren, wenn sie zwischen Enhancer und 
Promotor liegen, oder aber, zwischen Heterochromatin und einem Gen gelegen, das 
aktive Gen vor dem Einfluli des Heterochromatins schutzen. Beispiele fur solche 
Insulators sind: 1. sogenannte LCR (locus control regions), welche aus mehreren 
gegenuber DNAase I hypersensitiven Stellen besteht; 2. bestimmte Sequenzen wie 
SCS (specialized chromatin structures) bzw. SCS\ 350 bzw. 200 bp lang und hoch- 
resistent gegen Degradierung durch DNAase I und auf beiden Seiten von 
hypersensitiven Stellen flankiert (Abstand je 100 bp). An scs' bindet das Protein BEAF- 
32. Diese Insulators konnen auf beiden Seiten des Gens liegen. 

Eine Obersicht uber den Stand der Technik in der Oligomer Array Herstellung laSt sich 
auch einer im Januar 1999 erschienen Sonderausgabe von Nature Genetics (Nature 
Genetics Supplement, Volume 21, January 1999) und der dort zitierten Literatur 
entnehmen. 

Patente, die sich allgemein auf die Verwendung von Oligomer Arrays und 
photolithographisches Maskendesign beziehen, sind z. B. US-A 5,837,832, US-A 
5,856,174, WO-A 98/27430 und US-A 5,856,101. Zudem existieren einige Stoff- und 
Verfahrenspatente, welche die Verwendung photolabiler Schutzgruppen an 
Nukleosiden einschranken, so z. B. WO-A98/39348 und US-A 5,763,599. 

Matrix-assistierte Laser Desorptions/lonisations Massenspektrometrie (MALDI) ist eine 
neue, sehr leistungsfahige Entwicklung fur die Analyse von Biomolekulen (Karas, M. 
and Hillenkamp, F. 1988. Laser desorption ionization of proteins with molecular masses 
exceeding 10.000 daltons. Anal. Chem. 60: 2299-2301). Ein Analytmolekul wird in eine 
im UV absorbierende Matrix eingebettet. Durch einen kurzen Laserpuls wird die Matrix 
ins Vakuum verdampft und das Analyt so unfragmentiert in die Gasphase befordert. 
Eine angelegte Spannung beschleunigt die lonen in ein feldfreies Flugrohr. Auf Grund 
ihrer verschiedenen Massen werden lonen unterschiedlich stark beschleunigt. Kleinere 
lonen erreichen den Detektor fruher als groSere und die Flugzeit wird in die Masse der 
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lonen umgerechnet. 

Fur die Abtastung eines immobilisierten DNA-Arrays sind vielfach fluoreszent markierte 
Sonden verwendet worden. Besonders geeignet sind fur die Fluoreszenzmarkierung ist 
das einfache Anbringen von Cy3 und Cy5 Farbstoffen am 5'OH der jeweiligen Sonde. 
Die Detektion der Fluoreszenz der hybridisierten Sonden erfolgt beispielsweise uber ein 
Konfokalmikroskop. Die Farbstoffe Cy3 und Cy5 sind, neben vielen anderen, 
kommerziell erhaltlich. 

Um die erwartete Anzahl von amplifizierten Fragmenten ausgehend von einer 
beliebigen Templat-DNA und zweien nicht fiir jeweils eine bestimmte Position 
spezifischen Primem zu berechnen, muB ein statistisches Modell uber den Aufbau des 
Genoms zu Grunde gelegt werden. 

Wir geben hier die Berechnung fiir drei Modelle an, beziehen uns allerdings in diesem 
Patent auf die in Modell 3 beschriebene Methode. 

Modell 1 : 

Im einfachsten Fall wird angenommen, dafi ein primarer DNA-Strang eine Zufallsfolge 
von vier gleich haufig vorkommenden Basen ist. Damit ergibt sich als 
Wahrscheinlichkeit, dali sich fur einen beliebiger Primer PrimA (der Lange k) an einer 
gegebenen Stelle im Genom eine perfekte Basenpaarung ergibt: 

P a {PrimA)=0. 25 k (Modell 1 fUr DNA) 

(diese Wahrscheinlichkeit ist fur den sense- und anti-sense-Strang der DNA gleich) 

Bei einer Bisulfitbehandlung der DNA werden diejenigen Cytosine durch Uracil ersetzt, 
die nicht zu einem methylierten CG gehoren. Das Basenpaarungsverhalten des Uracils 
entspricht dem des Thymins. Da CG in der DNA sehr selten sind (unter zwei Prozent) 
kann die statistische Haufigkeit der Cs nach der Bisulfitbehandlung vernachlassigi 
werden. Die Wahrscheinlichkeit, daB sich fur einen Primer PrimB (Lange k, davon a As 
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t Is, g Gs und c Cs) auf bisulfitbehandelter DNA eine perfekte Basenpaarung ergibt, ist 
unterschiedlich fur einen mit Bisulfit behandelten Strang und den zugehorigen anti- 
sense Strang: 

P / J/Vim£)=0.5 a *0.25'*0.25'*0* (Modell 1 fur Bisulfit-DNA-Strang) 

P /a (Pr/m5)=0.25°*0.5'*0' *0.25 8 (Modell 1 fur anti-sense-Strang zu einem 
Bisulfit-DNA-Strang) 

(wenn der Primer C oder G enthalt, wird somit einer der Wahrscheinlichkeitswerte 0). 
Modell 2: 

Zahlungen der Basenhaufigkeiten der DNA ergeben, dafl die vier Basen in der DNA 
nicht gleichverteilt sind. Entsprechend kann man aus DNA-Datenbanken folgende 
Haufigkeiten (Wahrscheinlichkeiten fiir ein Vorkommen) der Basen ermitteln. 

/> DM4 U)=0.2811 
/> DAM (7>0.2784 
P DNA (C)=0.2206 
P DW ,(G)=0.2199 

Als Grundlage fur diese Statistik (und die folgenden fur Modell 2 und 3) dienen ca. 6% 
des Genoms vom Homo Sapiens aus High Throughput Sequencing Projekten 
(Datenbank "htgs" vom NIH/NCBI vom 6.9.1999). Die Gesamtmenge der Daten betragt 
mehr als 1.5x10 8 Basenpaare, was einem Schatzfehler fur die 
Einzelwahrscheinlichkeiten kleiner 10 s entspricht. 

Mit Hilfe dieser Werte lalit sich das Modell 1 verbessern. 

Damit ist die Wahrscheinlichkeit, da& sich fur einen Primer PrimC (Lange k, davon a 
As, t Is, g Gs und c Cs) eine perfekte Basenpaarung ergibt: 
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P2{PrimC)=P DNA (Ty*P DN M)'*P DNA (CY*P DNA (GT (Modell 3 fur DNA) 

Fur den mit Bisulfit behandelten Strang ergeben sich folgende Wahrscheinlichkeiten 
unter der Annahme, daS alle CpG-Positionen methyliert sind (man erhalt eine gleiche 
Statistik fQr die Bisulfitbehandlung des DNA-sense- und des DNA-antisense-Stranges): 

^W^)=0.2811 
^(C)=0.0140 
^(0=0.2199 
^£,m<(^)=0.4850 

Damit ergibt sich als Wahrscheinlichkeit, da& sich fur einen Primer PrimD (Lange k, 
davon a As, t Ts, g Gs und c Cs) eine perfekte Basenpaarung ergibt: 

P*{PrimD)=P bONA {TY*P bDNA {A)'*P bDNA {CY *P bONA {G) c (Modell 3 fur Bisulfit-DNA- 
Strang) 

P2.(PrimD)=P^(A)Up^(Ty*p kotu (GY*P UJIU (CY (Modell 3 fur anti-sense- 
Strang zu einem Bisulfit-DNA-Strang) 

Modell 3: 

Wesentliche Schatzfehler in Modell 2 ergeben sich vor allem bei der mit Bisulfit 
behandelten DNA aus der Tatsache, daS C nur noch im Kontext CG auftreten kann. 
Modell 3 berucksichtigt diese Eigenschaft und nimmt an, daB die primare DNA eine 
Zufallsfolge mit Abhangigkeit direkt benachbarter Basen ist (Markov-Kette erster 
Ordnung). Die empirisch aus der Datenbank (vollstandig methyliert; mit Bisulphit 
behandelt) ermittelten paarweisen Basenwahrscheinlichkeiten ergeben sich gleich fur 
beide DNA-Strange als P bMA ( von, nach) aus der folgenden Tabelle: 
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Von\nach 


A 


C 


G 


T 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



/WC)-0.0140 
WG)=0.2199 
P iDNA (T)=0AS50 



und fOr den dazu revers-komplementaren Strang (durch entsprechendes Austauschen 
der Eintrage) P r bDm ( von '• nach) 



Von\nach 


A 


C 


G 


T 


A 


0.2729 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 


0.0 


0.0894 



^™U)=0.4850 ; 

^(0=0.2199 

^WG)=0.0140 



Damit hangt die Wahrscheinlichkeit, dad sich fur einen Primer PrimE (mit der 
Basenfolge Bi B 2 B 3 B 4 ...; z.B. AUG...) eine perfekte Basenpaarung ergibt, von der 
genauen Abfolge der Basen ab und ergibt sich als das Produkt: 

P 3 s(PrimE)-P rbDNA {B i )—- — — — — ... (Modell 3 fur 

r rbDNA\ D \) r rbDNA\ D 2> r rbDNAX^il 
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Bisulfit-DNA-Strang) 

P M (PrimE)= P.,,,, I R.) P » DNA {B > i B " ] P b °»< {D > : gjj *W*3 j gjj 

bDNA ° P bD M) P bDNA (B 2 ) P bmA (B 3 ) - (ModellSfur 

anti-sense-Strang zu einem Bisulfit-DNA-Strang) 

Berechnung der Anzahl der zu erwartenden amplifizierten Fragmente 

Die mit Bisulfit behandelte DNA wird unter Benutzung einer Anzahl Primer amplifiziert. 
Aus Sicht des Modells besteht die DNA aus je einem sense- und einem anti-sense- 
Strang der Lange N Basen (alle Chromosomen werden hier zusammengefa&t). Fur 
einen Primer Prim ist zu erwarten, daB er auf dem sense-Strang 

N*P t {Prim) 



perfekte Basenpaarungen ergibt - fur diese Berechnung konnen die Funktionen P 1s , P, 
oder P 3S von Modell 1, 2 oder 3 eingesetzt werden, je nach gewunschter 
Abschatzungsgute. Werden mehrere Primer (PrimU, PrimV, PrimW, PrimX, etc.) 
gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fur eine perfekte 
Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

P s ( Primers )=/»,( Prim U ) 

+{\-P,(PrimU))P,{PrimV) 

+( I - P x (PrimU))( 1 - P s {PrimV))P s (PrimW) 

H\-PAPrimU))(l~P;(PrimV))(\-P x (PrimW))P x (PrimX) 
+ ... 



Und damit als Anzahl der zu erwartenden perfekten Basenparungen mit irgendeinem 
der Primer 



2s 



N *P s {Primers) 
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Fur die Bestimmung von P a (Primers) auf dem anti-sense-Strang werden die analogen 
Gleichungen verwendet. Ein Amplifikat entsteht genau dann, wenn bei einer perfekten 
Basenpaarung auf dem sense-Strang innerhalb der maximalen Fragmentlange M ein 
Primer auf dem Gegenstrang eine perfekte Basenpaarung bildet Die 
Wahrscheinlichkeit dafur ist 



P u (Primers)Y,^ 0 ' ( 1 - P u {Primers)) 



Fiir gro&e M und kleine P a (Primers) kann dieses durch folgenden Ausdruck berechnet 
werden: 



log{\ -PjPrimers)) 



Fur die Gesamtzahl F der Fragmente, die durch die Amplifikation beider Strange zu 
erwarten sind, ergibt sich damit: 



v {I- PA Primers)) ,, , . 
{\-P .(Printers)) u , 



Diese Methode liefert einen prazisen Erwartungswert fur die Vorhersage der Anzahl der 
Bindungssites bestimmter Sequenzen an ein beliebiges zuvor mit Bisulfit behandeltes 
genomisches DNA Fragment Sie dient hier als Grundlage fiir die Berechnung der 
statistisch erwarteten Anzahl von Amplifikaten in einer PCR-Reaktion ausgehend von 
zwei Primersequenzen und einer DNA der Lange N } wobei nur die Amplifikate 
berucksichtigt werden, die eine Anzahl von M Nukleotiden nicht uberschreiten. In 
diesem Patent wird davon ausgegangen, dafc M den Wert 2000 hat. 
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Die bekannten Verfahren fur den Nachweis von Cytosin Methylierungen in genomischer 
DNA sind prinzipiell nicht so ausgelegt, daB eine Vielzahl von Zielregionen im zu 
untersuchenden Genom gleichzeitig erfafct werden. Aufgabe der vorliegenden 
Erfindung ist es, ein Verfahren zu schaffen, mil dem eine Probe genomischer DNA 
gleichzeitig an mehreren Positionen gleichzeitig auf Cytosin Methylierung hin 
untersucht werden kann. 



Die Aufgabe wird durch die kennzeichnenden Merkmale des Anspruchs 1 gelost. 
Vorteilhafte Weiterbildungen der Merkmal sind in den abhangigen Anspruchen 
gekennzeichnet. 

Im Unterschied zu anderen Verfahren kann nach chemischer Vorbehandlung der DNA 
durch Verwendung entsprechend angepaBter Primerpaare eine Amplifikation von vielen 
Zielregionen gleichzeitig erfolgen. Dabei ist es nicht unbedingt notwendig den 
Sequenzkontext alter dieser Zielregionen vorab zu kennen, da in vielen Fallen, wie 
nachfolgend auch beispielhaft aufgefuhrt, Konsensussequenzen aus der 
Sequenzierung verwandter Zielregionen bekannt sind, die wie unten beschrieben fur 
das Design fur bestimmte Zielregionen spezifischer oder selektiver Primerpaare 
eingesetzt werden konnen. Das Verfahren ist dann erfolgreich angewandt, wenn die 
Amplifikation der chemisch vorbehandelten genomischen DNA mehr Fragmente bis 
maximal 2000 Basenpaare Lange als statistisch zu erwarten aus den jeweils zu 
untersuchenden Zielregionen liefert. 

Dabei wird der statistische Erwartungswert fur die Anzahl dieser Fragmente uber die im 
Stand der Technik aufgefuhrten Formeln berechnet. Die Anzahl der im 
Amplifikationsschritt hergestellten Fragmente kann dagegen mittels einer beliebigen 
molekularbiologischen, chemischen oder physikalischen Methode nachgewiesen 
werden. 

Fur die Durchfuhrung der erforderlichen statistischen Betrachtungen, die auch fur die 
unten aufgefuhrten Anspruche relevant sind, werden die folgenden Werte 
angenommen: 
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Das menschliche haploide Genom enthalt 3 Miiiiarden Basenpaare und 100.000 Gene, 
die wiederum im Mittel eine 2000 Basenpaare lange mRNA codieren, die Gene 
inklusive der Introns sind durchschnittlich 15000 Basenpaare lang. Promotoren 
umfassen je Gen 1000 Basenpaare durchschnittlich. 1st daher der statistische 
Erwartungswert fur die Anzahl der Amplifikate, die ausgehend von zwei Primern in 
transkribierten Sequenzen liegen, zu berechnen, so ist zunachst der Erwartungswert fur 
das Gesamtgenom nach obiger Formel (Methode 3) zu berechnen und mit dem Anteil 
der transkribierten Sequenzen am Gesamtgenom zu berechnen. Analog wird fur Teile 
eines beliebigen Genoms sowie fur Promotoren und translatierte Sequenzen (mRNA 
codierend) vorgegangen. 

Die vorliegende Erfindung beschreibt somit ein Verfahren zur parallelen Detektion des 
Methylierungszustandes genomischer DNA. Dabei sollen mehrere Cytosin- 
Methylierungen in einer DNA-Probe gleichzeitig analysiert werden. Dazu werden die 
folgenden Verfahrensschritte nacheinander ausgefuhrt: 

Zuerst wird eine genomische DNA Probe derart chemisch behandelt, da& an der 5'- 
Position unmethylierte Cytosinbasen in Uracil, Thymin oder eine andere vom 
Hybridisierungsverhalten her dem Cytosin unahnliche Base verwandelt werden. 
Bevorzugt wird dazu die oben beschriebene Behandlung genomischer DNA mit Bisulfit 
(Hydrogensulfit, Disulfit) und anschlieliender alkalischer Hydrolyse verwendet, die zu 
einer Umwandlung nicht methylierter Cytosin-Nukleobasen in Uracil fuhrt. 

In einem zweiten Verfahrensschritt werden aus der vorbehandelten genomischen DNA 
mehr als zehn unterschiedliche Fragmente gleichzeitig durch Verwendung yon 
synthetischen Oligonukleotiden als Primer amplifiziert, wobei mehr als doppelt so viele 
Fragmente als statistisch zu erwarten aus an der Genregulation beteiligten, 
transkribierten und/oder translatierten Sequenzen stammen. Dies kann mittels 
verschiedener Methoden erreicht werden. 

In einer bevorzugten Variante des Verfahrens enthalt mindestens eines der fur die 
Amplifikation verwendeten Oligonukleotide weniger Nukleobasen als es statistisch fur 
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eine sequenzspezifische Hybridisierung an die chemisch behandelte genomische DNA 
Probe erforderlich ware, was zur Amplication mehrerer Fragmente gleichzeitig fiihren 
kann. Dabei ist die Gesamtzahl der in diesem Oligonukleotid enthaltenen Nukleobasen 
kleiner als 17. In einer besonders bevorzugten Variante des Verfahrens ist die Anzahl 
der in diesem Oligonukleotid enthaltenen Nukleobasen kleiner als 14. 

In einer weiteren, bevorzugten Variante des Verfahrens werden fur die Amplication 
mehr als 4 Oligonukleotide mit unterschiedlicher Sequenz gleichzeitig in einem 
Reaktionsgefafi veiwendet. In einer besonders bevorzugten Varianten werden zur 
Herstellung eines komplexen Amplifikates mehr als 26 verschiedene Oligonukleotide 
gleichzeitig verwendet. In einer besonders bevorzugten Variante des Verfahrens 
stammt mehr als eine doppelt so hohe Anzahl, wie statistisch zu erwarten, aus an der 
Regulation von Genen beteiligten Genomabschnitten, z.B. Promotoren und Enhancern, 
stammt, als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu erwarten 
ware. In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr 
als eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, 
die in mindestens einer Zelle des jeweiligen Organismus in mRNA transkribiert werden, 
Oder aber aus nach der Transkription in mRNA gespliceten Genomabschnitten 
(Exons), als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu erwarten 
ware. 

In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als 
eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, 
welche fur Teile einer oder mehrerer Genfamilien kodieren, oder aber sie stammen aus 
Genomabschnitten, welche fur sogenannte .matrix attachment sites" (MARs)- 
charakteristische Sequenzen enthalten, als bei einer rein zufalligen Wahl der 
Oligonukleotidsequenzen zu erwarten ware. 

In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als 
eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, 
welche als sogenannte ..boundary elements" die Verpackungsdichte des Chromatins 
organisieren, oder aber sie stammen aus multiple drug resistance gene" (MDR)- 
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Promotoren oder kodierenden Regionen, als bei einer rein zufalligen Wahl der 
Oligonukleotidsequenzen zu erwarten ware. 

In einer weiteren, besonders bevorzugten Variante des Verfahrens werden zur 
Amplifkation der beschriebenen Fragmente zwei Oligonukleotide oder zwei Kiassen von 
Oligonukleotiden verwendet, von denen eines oder eine Klasse aufcer im Kontext CpG 
oder CpNpG zwar die Base C enthalten kann, nicht aber die Base G und von denen 
das andere oder die andere Klasse aufcer im Kontext CpG oder CpNpG zwar die Base 
G, nicht aber die Base C enthalten kann. 

In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide durchgefuhrt, von denen eines eine vier bis sechzehn Basen 
lange Sequenz enthalt, die zu einer solchen DNA komplementar ist oder dieser 
entspricht, wie sie entstehen wiirde, wenn ein ebenso langes DNA Fragment, an 
welches einer der Faktoren 



AhR/Arnt 

Arnt 
AML-1a 

AP-1 

C/EBP 

C/EBPalpha 

C/EBPbeta 

CDP 

CDP 

CDP CR1 
CDP CR3 
CHOP-C/EBPalpha 

c-Myc/Max 

CREB 
CRE-BP1 



CRE-BP1/c-Jun 



aryl hydrocarbon receptor/aryl hydrocarbon receptor nuclear 
translocator 

aryl hydrocarbon receptor nuclear translocator 
CBFA2; core-binding factor, runt domain, alpha subunit 2 
(acute myeloid leukemia 1; aml1 oncogene) 
activator protein-1 (AP-1); Synonyme: c-Jun 
CCAAT/enhancer binding protein 
CCAAT/enhancer binding protein (C/EBP), alpha 
CCAAT/enhancer binding protein (C/EBP), beta 
CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

complement component (3b/4b) receptor 1 

complement component (3b/4b) receptor 3 

DDIT; DNA-damage-inducible transcript 3/CCAAT/enhancer 

binding protein (C/EBP), alpha 

avian myelocytomatosis viral oncogene/MYC-ASSOCIATED 
FACTOR X 

cAMP responsive element binding protein 
CYCLIC AMP RESPONSE ELEMENT-BINDING PROTEIN 
2, CREB2, CREBP1; now ATF2; activating transcription 
factor 2 

activator protein-1 (AP-1); Synonyme: c-Jun 
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CREB 
E2F 



E47 

E47 

Egr-1 
Egr-2 
ELK-1 

Freac-2 

Freac-3 

Freac-4 

Freac-7 

GATA-1 
GATA-1 
GATA-1 
GATA-2 
GATA-3 
GATA-X 
HFH-3 

HNF-1 

HNF-4 

IRF-1 

ISRE 

Lmo2 complex 
MEF-2 

MEF-2 

myogenin/NF-1 
MZF1 
MZF1 
NF-E2 

NF-kappaB (p50) 
NF-kappaB (p65) 



MP responsive element binding protein 
E2F transcription factor (originally identified as a DNA- 
binding protein essential E1A-dependent activation of the 
adenovirus E2 promoter) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) 

transcription factor 3 (E2A immunoglobulin enhancer bindinq 
factors E12/E47) 
early growth response 1 

early growth response 2 (Krox-20 (Drosophila) homolog) 
ELK1, member of ETS (environmental tobacco smoke) 
oncogene family 

FKHL6; forkhead (Drosophila)-like 6; FORKHEAD-RELATED 
ACTIVATOR 2; FREAC2 

FKHL7; forkhead (Drosophila)-like 7; FORKHEAD-RELATED 
ACTIVATOR 3; FREAC3 

FKHL8; forkhead (Drosophila)-like 8; FORKHEAD-RELATED 
ACTIVATOR 4; FREAC4 

FKHL11; forkhead (Drosophila)-like 9; FORKHEAD- 
RELATED ACTIVATOR 7; FREAC7 
GATA-binding protein 1 /Enhancer-Binding Protein GATA1 
GATA-binding protein 1/Enhancer-Binding Protein GATA1 
GATA-binding protein 1/Enhancer-Binding Protein GATA1 
GATA-binding protein 2/Enhancer-Binding Protein GATA2 
GATA-binding protein 3/Enhancer-Binding Protein GATA3 

FKHL10; forkhead (Drosophila)-like 10; FORKHEAD- 
RELATED ACTIVATOR 6; FREAC6 
TCF1; transcription factor 1, hepatic; LF-B1, hepatic nuclear 
factor (HNF1), albumin proximal factor 
hepatocyte nuclear factor 4 
interferon regulatory factor 1 
interferon-stimulated response element 
LIM domain only 2 (rhombotin-like 1) 
MADS box transcription enhancer factor 2, polypeptide A 
(myocyte enhancer factor 2A) 

MADS box transcription enhancer factor 2, polypeptide A 
(myocyte enhancer factor 2A) 
Myogenin (myogenic factor 4)/Neurofibromin V 
NEUROFIBROMATOSIS, TYPE I 

ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 
responsive) 

ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 
responsive) 

NFE2; nuclear factor (erythroid-derived 2), 45kD 

nuclear factor of kappa light polypeptide gene enhancer in B- 

cells p50 subunit 

nuclear factor of kappa light polypeptide gene enhancer in B- 
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NF-kappaB 

NF-kappaB 

NRSF 

Oct-1 

Oct-1 

Oct-1 

Oct-1 

Oct-1 

P300 

P53 

Pax-1 

Pax-3 

Pax-6 

Pbx,1b 

Pbx-1 

RORalpha2 

RREB-1 

SP1 

SP1 

SREBP-1 
SRF 

SRY 
STAT3 

Tal-1alpha/E47 

TATA 
Tax/CREB 

Tax/CREB 

TCF11/MafG 

TCF11 

USF 
Whn 



cells p65 subunit 

nuclear factor of kappa light polypeptide gene enhancer in B- 
cells 

nuclear factor of kappa light polypeptide gene enhancer in B- 
ceils 

NEURON RESTRICTIVE SILENCER FACTOR; REST; RE1- 
silencing transcription factor 

OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 
POU2F1; POU domain, class 2, transcription factor 1 
E1A (adenovirus E1 A oncoprotein)-BINDING PROTEIN, 
300-KD 

tumor protein p53 (Li-Fraumeni syndrome); TP53 
paired box gene 1 

paired box gene 3 (Waardenburg syndrome 1) 

paired box gene 6 (aniridia, keratitis) 

pre-B-cell leukemia transcription factor 

pre-B-cell leukemia transcription factor 1 

RAR-RELATED ORPHAN RECEPTOR ALPHA; RETINOIC 

ACID-BINDING RECEPTOR ALPHA 

ras responsive element binding protein 1 

simian-virus-40-protein-1 

simian-virus-40-protein-1 

sterol regulatory element binding transcription factor 1 
serum response factor (c-fos serum response element- 
binding transcription factor) 
sex determining region Y 

signal transducer and activator of transcription 1, 91 kD 
T-cell acute lymphocytic leukemia 1 /transcription factor 3 
(E2A immunoglobulin enhancer binding factors E12/E47) 
cellular and viral TATA box elements 
Transiently-expressed axonal glycoprotein/cAMP responsive 
element binding protein 

Transiently-expressed axonal glycoprotein/cAMP responsive 
element binding protein 

v-maf musculoaponeurotic fibrosarcoma (avian) oncogene 
family, protein G 

Transcription Factor 11; TCF11; NFE2L1; nuclear factor 
(erythroid-derived 2)-like 1 
upstream stimulating factor 
winged-helix nude 
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X-BP-1 X-box binding protein 1 Oder 

ubiquitously distributed transcription factor belonging to 
theGLI-Kruppel class of zinc finger proteins 

bindet, derart chemisch behandelt wiirde, da& an der 5'-Position unmethylierte 
Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her 
dem Cytosin unahnliche Base verwandelt werden. 

In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide oder zweier Klassen von Oligonukleotiden durchgefuhrt, von 
denen eines oder die eine Klasse die vier bis sechzehn Basen lange Sequenz enthalt, 
welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie sie 
entstehen wurde, wenn ein ebenso langes DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifuhren kann, derart 
chemisch behandelt wiirde, daB an der 5'-Position unmethylierte Cytosinbasen in 
Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin 
unahnliche Base verwandelt werden. 

In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide oder zweier Klassen von Oligonukleotiden durchgefuhrt, von 
denen eines oder die eine Klasse eine der Sequenzen 



TCGCGTGTA, TACACGCGA, TGTACGCGA, TCGCGTACA 
TTGCGTGTT, AACACGCAA, GGTACGTAA, TTACGTACC ' 
TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACC 
TTGCGTGTA, TACACGCAA, TGTACGTAA, TTACGTACA ' 
TACGTG, CACGTA, TACGTG, CACGTA, 

ATTGCGTGT, ACACGCAAT, GTACGTAAT, ATTACGTAC 
ATTGCGTGA, TCACGCAAT, TTACGTAAT, ATTACGTAA ' 
ATCGCGTGA, TCACGCGAT, TTACGCGAT, ATCGCGTAA 
ATCGCGTGT, ACACGCGAT, GTACGCGAT, ATCGCGTAC 
TGTGGT, ACCACA, ATTATA, TATAAT, 

TGAGTTAG, CTAACTCA, TTGATTTA, TAAATCAA 
TGATTTAG, CTAAATCA, TTGAGTTA, TAACTCAa! 
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TTTGGT, ACCAAA, ATT AAA, TTTAAT, 
TGTGGA, TCCACA, TTTATA, TATAAA , 
TTTGGA, TCCAAA, TTTAAA, TTTAAA, 
TGTGGT, ACCACA, ATTATA, TATAAT, 

ATTAT, ATAAT, GTAAT, ATTAC, 
ATTGT, ACAAT, GTAAT, ATTAC, 

GAAAG, CTTTC, I I I I I, AAAAA, 
GTAAT, ATTAC, ATTGT, ACAAT, 
GAAAT, ATTTC, ATTTT, AAAAT, 
GTAAG, CTTAC, TTTGT, ACAAA, 

TTAAT AATC GAT , ATCGATTATTAA, ATCG ATTATTG G , CCAATAATCGAT, 
ATCGATTA, TAATCGAT, TAATCGAT, ATCGATTA, 

ATCGATCGG, CCGATCGAT, TCGATCGAT, ATCGATCGA, 
ATCGATCGT, ACGATCGAT, GCGATCGAT, ATCGATCGC, 

TATCGATA, TATCGATA, TATCGGTG, CACCGATA, 
TATTAATA, TATTAATA, TATTGGTG, CACCAATA, 

GTGTAATATTT, AAATATTAC AC , GGGTATTGTAT, ATACAATACCC, 
GTGTAAI I I I I, AAAAATTAC AC , GGGGATTGTAT, ATACAATCCCC, 
ATGTAAI I I I I, AAAAATTACAT, GGGGATTGTAT. ATACAATCCCC, 
ATGTAATATTT, AAATATTACAT, GGGTATTGTAT, ATACAATACCC, 
ATTACGTGGT, ACCACGTAAT, ATTACGTGGT, ACCACGTAAT, 
TGACGTAA, TTACGTCA, TTACGTTA, TAACGTAA, 
TGACGTTA, TAACGTCA, TGACGTTA, TAACGTCA, 
TTACGTAA, TTACGTAA, TTACGTAA, TTACGTAA, 
TGACGTTA, TAACGTCA, TAACGTTA, TAACGTTA, 

TGACGT, ACGTCA, GCGTTA, TAACGC, 
TGACGT, ACGTCA, ACGTTA, TAACGT, 
TTTCGCGT, ACGCGAAA, GCGCGAAA, TTTCGCGC, 
TTTGGCGT, ACGCCAAA, GCGTTAAA, TTTAACGC, 

TAGGTGTTA, TAACACCTA, TAATATTTG, CAAATATTA, 
TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC, 

GTAGGTGG, CCACCTAC, TTATTTGT, ACAAATAA, 
GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT, 

TGCGTGGGCGG, CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA, 
TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT, 

TGCGTAGGCGT, ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT, 
TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA, 
ATAGGAAGT, ACTTCCTAT, ATTTTTTGT, ACAAAAAAT, 
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TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT 
TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC, 
TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT, 
TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAAC, 
GTAAATAA, TTATTTAC, TTGTTTAT, ATAAACAA, 
GTAAATAAATA, TATTTATTTAC, TGTTTATTTAT, ATAAATAAACA, 

AAAGTAAATA, TATTTACTTT, TGTTTATTTT, AAAATAAACA 
AATGTAAATA, TATTTACATT, TGTTTATATT, AATATAAACa' 
TAAGTAAATA, TATTTACTTA, TGTTTATTTA, TAAATAAACA 
TATGTAAATA, TATTTACATA, TGTTTATATA, TATATAAACA, 

ATAAATA, TATTTAT, TGTTTAT, ATAAACA, 
ATAAATA, TATTTAT, TATTTAT, ATAAATA, 
GATA, TATC, TATT, AATA, 

TAGATAA, TTATCTA, TTATTTG, CAAATAA 
TTGATAA, TTATCAA, TTATTAG, CTAATAA, 
GATAA, TTATC, TTATT, AATAA, 

GATG, CATC, TATT, AATA, 

GATAG, CTATC, TTATT, AATAA, 
GATAAG, C TTATC, TTTATT, AATAAA, 

TGTTTATTTA, TAAATAAACA, TAAATAAATA, TATTTATTTA 
TGTTTGTTTA, TAAACAAACA, TAAATAAATA, TATTTATTTA 
TATTTATTTA, TAAATAAATA, TAAATAAATA, TATTTATTTA ' 
TATTTGTTTA, TAAACAAATA, TAAATAAATA, TATTTATTTA, 

GTTAATGATT, AATCATTAAC, AATTATTAAT, ATTAATAATT 
GTTAATTATT, AATAATTAAC, AATAATTAAT, ATTAATTATT ' 
GTTAATTAAT, ATTAATTAAC, ATTAATTAAT, ATTAATTAAt' 
GTTAATGAAT, ATTCATTAAC, ATTTATTAAT, ATTAATAAAT, 

TAAAGTTTA, TAAACTTTA, TGAATTTTG, CAAAATTCA 
TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA, 

AAAGTGAAATT, AATTTCACTTT, GGTTTTATTTT, AAAATAAAACC 
AAAGCGAAATT, AATTTCGCTTT, GGTTTCGTTTT, AAAACG AAAC C , 

TAGTTTTATTTTTTT, AAAAAAATAAAACTA, GGGAAAGTGAAATTG 
CAATTTCACTTTCCC, 

TAGTTTTATTTTTTT, AAAAAAATAAAACTA, GGAAAAGTGAAATTG 
C AATTTC ACTTTTC C , 

TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, GGAAAAGAGAAATTG 
C AATTTC TCTTTTC C , 
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TAG I I I I I I I I I I I I , AAAAAAAAAAAACTA, GGGAAAGAGAAATTG, 

CAATTTCTCTTTCC C , 

TAGGTG, CACCTA, TATTTG, CAAATA, 

TTTTAAAAATAATTTT , AAAATT ATTTTT AAAA , AGGGTTA I I I I I AG AG, 
CTCTAAAAATA ACCCT , 

TTTT AAAAAT AATTTT, AAAATT ATTTTT AAAA , GGAGTTA I I I I I AG AG, 
CTCTAAAAATA ACTCC , 

TTTTAAAAATAATTTT, AAAATT ATTTTT AAAA, AGAGTTA I I I I I AG AG, 
CTCT AAAAATA ACTCT , 

TTTTAAAAATAATTTT, AAAATT ATTTTT AAAA , GGGGTT ATTTTT AGAG, 
CTCTAAAAATAACCCC, 

TGTTATTAAAAATAGAAA. TTTCTAI I I I I AATAACA, 
I I I I IAI I I I I AGTAATA, TATTACT AAAAAT AAAAA, 
TGTTATTAAAAATAG AAT , ATTCTATTTTTAATAACA, 
GTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAC, 
TTTGGTAT, ATACCAAA, GTGTTAAA, TTTAACAC 
GGGGA, TCCCC, TTTTT, AAAAA, 

TAGGGG, CCCCTA, TTTTT A, T AAAAA, 
GAGGGG, CCCCTC, I I I I I I, AAAAAA, 

TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, 
TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, 
TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, 
TGTTG ATTTAT , ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, 
GGGGA TTTTT , AAAAATCCCC, GGGAA Mill, AAAAATTCCC, 
GGGGA Mill, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, 
GGGG A I I I I I , AAAAATCCCC, GGAAA Mill, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAA I I I I I, AAAAATTTCC, 
GGGAT TTTTT , AAAAAATCCC, GGAAAGTTTT, AAAACTTTCC, 
GGGA A I MM , AAAAATTCCC, GGGAATTTTT, AAAAATTCCC, 
GGGATTTTTT, AAAAAATCCC, GGGAAGTTTT, AAAACTTCCC, 
GGGAI II II IA, TAAAAAATCCC, TGGAAAGTTTT, AAAACTTTCCA, 
T TTAGT ATTACGGATAGAGGT, ACCTCTATCCGTAATACTAAA, 
G I I I I I GTTCGTGGTGTTGAA, TTCAAC ACCAC GAACAAAAAC , 
TT TAGTA TT AC GG ATAG AGTT, AACTCTATCCGTAATACTAAA, 
GGTTTTGTTCGTGGTGTTGAA, TTCAACACCAC G AAC AAAAC C , 
TTTAGTATTACGGATAGCGTT, AACGCTATCCGTAATACTAAA, 
GGCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGCC, 
TTTAGTATTACGGATAGCGGT, ACCGCTATCCGTAATACTAAA, 
GTCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGAC, 

ATATGTAAAT, ATTTACATAT, ATTTGTATAT, ATATACAAAT, 
TTATGTAAAT, ATTTACATAA, ATTTGTATAA, TTATACAAAT, 



GAATATTTA, TAAATATTC, TGAATATTT, AAATATTCA, 



WO 01/42493 PCT/DE00/04381 

22 



GAATATGTA, TACATATTC, TGTATATTT, AAATATACA, 

ATAAT, ATTAT, ATTAT, ATAAT, 
GTAAT, ATT AC, ATTAT, ATAAT, 

AATGTAAAT, ATTTACATT, ATTTGTATT, AATACAAAT, 

ATTTGTATATT, AATATACAAAT, GGTATGTAAAT, ATTTACATACC 
ATTTGTATATT, AATATACAAAT, AATATGTAAAT, ATTTACATATT ' 
ATTTGTATATT, AATATACAAAT, AGTATGTAAAT, ATTTACATACT 
ATTTGTATATT, AATATACAAAT, GATATGTAAAT, ATTTACATATC, 

AGGAGT, ACTCCT, AT I III, AAAAAT 
GGGAGT, ACTCCC, ATTTTT, AAAAAT, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC ' 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC' 
AGATATGT TCGG GTATGTTT, AAACATACCCGAACATATCT ' 
TCGTTTCGTTTTAGATAT, ATATCTAAAACGAAACGA 
ATATTTAGAGCGGAACGG, CCGTTCCGCTCTAAATAT, 

CGTTACGGTT, AACCGTAACG, AATCGTGACG, CGTCACGATT 
CGTTACGGTT, AACCGTAACG, GATCGTGACG, CGTCACGATC 
CGTTACGTTT, AAACGTAACG, AAGCGTGACG, CGTCACGCTT ' 
CGTTACGTTT, AAACGTAACG, GAGCGTGACG, CGTCACGCTC, 

TTTAC GTATG A, TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA 
TTTACGTTTGA, TCAAACGTAAA, TTAAGCGTGAA, TTCACGCTTAa' 
TTTAC GTTTTA, TAAAACGTAAA, TGAAGCGTGAA, TTCACGCTTCa' 
TTTAC GTATTA, TAATACGTAAA, TGATGCGTGAA, TTCACGCATCA, 

AATTAATTAA, TTAATTAATT, TTGATTGATT, AATCAATCAA 
TATTAATTAA, TTAATTAATA, TTGATTGATG, CATCAATCAA, 

TAATTAT, ATAATTA, ATGATTG, CAATCAT, 

TAGGTTA, TAACCTA, TGATTTA, TAAATCA, 

TTTTAAATATTTTT, AAAAATATTTAAAA, GGGGGTGTTTGGGG 
CCCCAAACACCCCC, 

TTTTAAATTATTTT, AAAATAATTTAAAA, GGGGTGGTTTGGGG 
CCCCAAACCACCCC, 

TTTTAAATT Mill, AAAAAAATTTAAAA, GGGGGGGTTTGGGG 
CCCCAAACCCCCCC, 

TTTT AAAT AATTTT , AAAATT ATTTAAAA , GGGGTTGTTTGGGG 
CCCCAAACAACCCC, 



GAGGCGGGG, CCCCGCCTC, TTTCGTTTT, AAAACGAAA, 
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GAGGTAGGG, CCCTACCTC, TTTTGTTTT, AAAACAAAA, 
AAGGCGGGG, CCCCGCCTT, TTTCGTTTT, AAAACGAAA, 
AAGGTAGGG, CCCTACCTT, TTTTGTTTT, AAAACAAAA, 

GGGGGCGGGGT, ACCCCGCCCCC, ATTTCGTTTTT, AAAAACGAAAT, 
GGGGGCGGGGT, ACCCCGCCCCC, GTTTCG Mill, AAAAACGAAAC, 
TATTATTTTAT, ATAAAATAATA, GTGG GGTGATA, TATCACCCCAC, 
GATTATTTTAT, ATAAAATAATC, GTGGGGTGATT, AATCACCCCAC, 

ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, 
ATTACGTGAT, ATCACGTAAT, GTTACGTGAT, ATCACGTAAC, 

TTTTATATGG, CCATATAAAA, TTATATAAGG, CCTTATATAA, 
TTATATATGG, CCATATATAA, TTATATATGG, CCATATATAA, 
AAATAAT, ATTATTT, GTTGTTT, AAACAAC, 
AAATTAA, TTAATTT, TTAGTTT, AAACTAA, 
AAATTAT, ATAATTT, GTAGTTT, AAACTAC, 
AAATAAA, TTTATTT, TTTGTTT, AAACAAA, 

AMU I CGGAAATG, CATTTCCGAAAAAT, TATTTTCGGGAAAT, 
ATTTCCCGAAAATA, 

All I I I CGGAAATG, CATTTCCGAAAAAT, TATTTTCGGGAAAT, 
ATTTCCCGAAAATA, 

ATTTTCGGGAAATG, CATTTCCCGAAAAT, TAM II I CGGAAAT, 
ATTTCCGAAAAATA, 

ATTTTCGGGAAGTG, CACTTCCCGAAAAT, TATTTTTCGGAAAT, 
ATTTCCGAAAAATA, 

AATAGATGTT, AACATCTATT, AATATTTGTT, AACAAATATT, 
AATAGATGGT, ACCATCTATT, ATTATTTGTT, AACAAATAAT, 

GTATAAATA, TATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAATG, CATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAAAA, I I I I IATAC, TTTTTATAT, ATATAAAAA, 
GTATAAAAG, CTTTTATAC, TTTTTATAT, ATATAAAAA, 
TTATAAATA, TATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAATG, CATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAAAA, I II I IATAA, TTTTTATAG, CTATAAAAA, 
TTATAAAAG, CTTTTATAA, TTTTTATAG, CTATAAAAA, 
GGGGGTTGACGTA, TACGTCAACCCCC, TGC GTTAATTTTT , 
AAAAATTAACGCA, 

GGGGGTTGACGTA, TACGTCAACCCCC, TAC GTTAATTTTT, 
AAAAATT AAC GTA , 

TGACGTATA I I I I I, AAAAATATACGTCA, GGGGATATGCGTTA, 
TAACGCATATCCCC, 

TGACGTATA I II I I, AAAAATATACGTCA, GGGGGTATGCGTTA, 
TAACGCATACCCCC, 
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ATGATTTAGTA, TACTAAATCAT, TGTTGAGTTAT, ATAACTCAACA 
GTTAT, ATAAC, ATGAT, ATCAT, 

TTACGTGA, TCACGTAA, TTACGTGG, CCACGTAA 
TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA 
TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA 
TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, 
GACGTT, AACGTC, AGCGTT, AACGCT, 

TGACGTGT, ACACGTCA, ATACGTTA, TAACGTAT 
TGACGTGG, CCACGTCA, TTACGTTA, TAACGTAA 
CGGTTATTTTG, CAAAATAACCG, TAAGATGGTCG Oder CGACCATCTTA 

enthalt, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie sie 
entstehen wurde, wenn ein ebenso langes DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifuhren kann, derart 
chemisch behandelt wurde, da& an der 5'-Position unmethylierte Cytosinbasen in 
Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin 
unahnliche Base verwandelt werden. 

In einer besonders bevorzugten Variante des Verfahrens enthalten die zur Amplifikation 
verwendeten Oligonukleotide auBer den oben definierten Konsensussequenzen 
mehrere Positionen, an denen entweder irgendeine der drei Basen G, A und T oder 
irgendeine der Basen C, A und T vorhanden sein kann. 



In einer besonders bevorzugten Variante des Verfahrens enthalten die zur Amplifikation 
verwendeten Oligonukleotide auBer einer der oben beschriebenen Konsensus- 
sequenzen nur maximal zusatzlich so viele weitere Basen, wie es zur gleichzeitigen 
Amplifikation von mehr als einhundert verschiedenen Fragmenten pro Reaktion aus der 
chemisch wie oben behandelten DNA erforderlich ist. 

In einem dritten Verfahrensschritt wird nun der Sequenzkontext aller oder eines Teils 
der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG 
Trinukleotide untersucht. 
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In einer besonders bevorzugten Variante des Verfahrens erfolgt die Analyse durch 
Hybridisierung der bereits in der Amplifikation mit einem Fluoreszenzmarker 
versehenen Fragmente an einen Oligonukleotid- Array (DNA Chip). Der 
Fluoreszenzmarker kann entweder uber die verwendeten Primer oder aber durch ein 
fluoreszenzmarkiertes Nukleotid (z. B. Cy5-dCTP, kommerziell von Amersham- 
Pharmacia erhaltlich) eingefuhrt werden. 

Dabei hybridisieren komplementare Fragmente an die jeweiligen auf der 
Chipoberflache immobilisierten Oligomere, nicht komplementare Fragmente werden in 
einem oder mehreren Waschschritten entfernt. Die Fluoreszenz an den jeweiligen 
Hybridisierungsorten auf dem Chip erlaubt dann den RuckschlufJ auf den 
Sequenzkontext der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide 
oder CpNpG Trinukleotide. 

In einer weiteren bevorzugten Variante des Verfahrens werden die amplifizierten 
Fragmente auf einer Oberfiache immobilisiert und anschlieBend eine Hybridisierung mit 
einer kombinatorischen Bibiliothek von unterscheidbaren Oligonukleotid- oder PNA- 
Oligomer-Sonden durchgefuhrt. Wiederum werden nicht komplementare Sonden durch 
einen oder mehrere Waschschfitte entfernt. Die hybridisierten Sonden werden 
entweder uber ihre Fluoreszenzmarker detektiert oder in einer weiteren besonders 
bevorzugten Variante des Verfahrens mittels Matrix-assistierter Laser- 
Desorptions/lonisations Massenspektrometrie (MALDI-MS) anhand ihrer eindeutigen 
Masse nachgewiesen. Dabei werden die Sondenbibliotheken derart synthetisiert, daR 
die Masse eines jeden Bestandteils eindeutig seiner Sequenz zugeordnet werden kann. 

Die Amplifikate konnen zudem in einer weiteren bevorzugten Variante des Verfahrens 
hinsichtlich Ihrer durchschnittlichen GroBe durch Veranderung der 
Kettenverlangerungszeiten im Amplifikationsschritt beeinfluRt werden. Da hier 
vorwiegend kleinere Fragmente (ca. 200-500 Basenpaare) untersucht werden, ist eine 
Verkurzung der Kettenverlangerungsschritte z. B. einer PCR sinnvoll. 

In einer weiteren bevorzugten Variante des Verfahrens werden die Amplifikate durch 
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Gelelektrophorese aufgetrennt, und die Fragmente im gewunschten GroBenbereich 
werden vor Hirer Analyse ausgeschnitten. In einer weiteren besonders bevorzugten 
Variante werden die aus dem Gel ausgeschnittenen Amplifikate unter Verwendung des 
gleichen Satzes an Primern erneut amplifiziert. Dabei kSnnen dann nur noch 
Fragmente der gewunschten Grofie entstehen, da Andere als Templat nicht mehr 
verfiigbar sind. 



Ein weiterer Gegenstand der vorleigenden Erfindung ist ein Kit, enthaltend mindestens 
zwei Primerpaare, Reagenzien und Hilfsstoffe fur die Amplifikation und/oder 
Reagenzien und Hilfsmittel fur die chemische Behandlung und/oder eine 
kombinatorische Sondenbibliothek und/oder einen Oligonukleotid-Array (DNA-Chip), 
soweit sie fur die Durchfuhrung des erfindungsgema&en Verfahrens erforderlich oder 
dienlich sind. 



Die folgenden Beispiele eriautern die Erfindung. 



Beispiele: 
Beispiel 1 : 

Primer zur bevorzugten Amplifikation von CG reichen Regionen im Humangenom 

Bei den CG reichen Regionen im Humangenom handelt es sich urn sogenannte CpG- 
islands, die eine regulatorischen Funktion besitzen. Wir definieren CpG Islands derart. 
dass sie mindestens 500 bp umfassen sowie einen GC-Gehalt von >50% aufweisen , 
ausserdem ist der Quotient CG/GC > 0,6. Unter diesen Bedingungen liegen 16 Mb als 
CpG Islands vor. Damit liegen etwa 0,5 % der Genomsequenz in diesen CpG islands, 
wenn man auch noch jeweils eine Region bis 1000 bp downstream zusatzlich 
betrachtet. Dieser Uberlegung liegen Daten aus der Ensembl Database vom 31.10.00, 
Quelle Sanger Centre, zugrunde. Die dort verfiigbare Sequenz umfasste ca. 3,5 GB, 
und fur die Berechnungen wurden die Repeats maskiert. 

Statistisch ware es bei 12meren zu erwarten, dass sie nur 0,005 mal so haufig an eine 
der CG-reichen Regionen hybridisieren wie an eine andere beliebige Region im 
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Genom. Es wurden nun Primer gefunden, welche 1,8 mal haufiger an eine CG reiche 
Region binden. Zudem ergibt sich mit den entsprechend gefundene Reverse Primer 
nahezu eine Spezifitat fur diese CpG islands. 

In diesem Beispiel sind die Primer AGTAGTAGTAGT (Seq. ID 1) AAAACAAAAACC 
(Seq. ID 2) und alternate AGTAGTAGTAGT (Seq. ID 19) und ACAAAAACTAAA (seq 
ID 20). Das erste Primerpaar fuhrt mindestens zu den Amplifikaten Seq. ID 3 bis 18, 
das zweite Primerpaar zu den Amplifikaten der Seq. ID 21 bis 31 . 



Beispiel 2: 

Berechnung der Vorhersage der Anzahl von Amplifikaten in Genomischen Regionen. 

GemaB Anspruch 8 im Patent wird gezeigt mehr als doppelt so viele Amplifikate 
erstellen zu konnen, als es statistisch zu erwarten ware nach Forme! 1. 

F=N *P s {P rim ers) -^^^ [( 1 - P a (Primers))" - 1 ] 
log ( 1 —P a [Primers )) 

+N *P m (Primers) / Sgli [( j -P s ( Pr i m ers)) M - 1 ] 
log(l -P s (Pnmers)) 3 

F gibt dabei die Anzahl der Vorhergesagten Amplifikate an, die zu erwarten sind, wenn 
man N Basen als Datenbasis aus dem Genom betrachtet. P ist die jeweilige 
Wahrscheinlichkeitfurdie Hybridisierung eines Primeroligonukleotids, getrennt nach 
Hybridisierung im Sense- und Antisense-Strang. M ist die maximal zulassige Lange der 
zu erwartenden Amplifikate. 



Die Wahrscheinlichkeit P wird bestimmt durch eine Markov Kette erster Ordnung. Dabei 
wird die Annahme gemacht, dass die DNA eine Zufallsfolge in Abhangigkeit 
benachbarter Basen ist. Fur die Berechnung einer Markovkette sind die 
Ubergangswahrscheinlichkeiten von benachbarten Basen notwendig. Diese wurden 
empirisch aus 12% des assemblierten humanen Genoms, das vollstandig mit Bisulfit 
behandelt wurde, ermittelt und in Tabelle 1 zusammengefasst. In Tabelle 2 sind die 
Gbergangswahrscheinlichkeiten fur den entsprechenden komplementar reversen 
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Strang angegeben. Diese ergeben sich durch einfaches Vertauschen der Eintrage aus 
derTabelle 1. 



Tabelle 1 



VonXnach 


A 


C 


G 


7 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



mit 

^WC)=0.0140 
iW<?)=0.2199 
P bDM (T)=OAS50 

und for den dazu revers-komplementaren Strang (durch entsprechendes Austauschen 
der Eintrage) ( von ; nach) 



Tabelle 2 



Von\nach 


A 


C 


G 


7 


A 


0.2729 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 


0.0 


0.0894 



^om,U)=0.4850 
^«>m« (0=0.2199 
^«>m,(G)=0.0140 
iW7>0.2811 



Damit hangt die Wahrscheinlichkeit, dass sich fur einen Primer PrimE (mit der 
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Basenfolge Bi B 2 B 3 B 4 z.B. AUG...) eine perfekte Basenpaarung ergibt, von der 
genauen Abfolge der Basen ab und ergibt sich als das Produkt: 

D ( D~™X7\ D /p \ ft&OA^ ft > ^ft) ft- MWyc (^2'ft) ^ rbDNA (-ft * ft) 

P is {PrimE)=P rbDNA {B x ) — — — — — . . . 

PrbDNA\ B \) * rbDNA \**2J t rbDNA\#l) 

(Bisulfit-DNA-Strang) 

p / D«*t'm^ J?\ D / p \ ^bONA^X » ft) PbDNA^l' ft) ? W jjjft* ft) 

F 3a [Frimt)-P bDNA [B,)— — — r —r — ... 

" bPNA \**\) P bDNA^ 2' * bDNA 

(anti-sense-Strang zu einem Bisulfit-DNA-Strang); 
fur einen Primer Pr/m auf dem sense-Strang ergeben sich 

N*P s (Prim) 

perfekte Basenpaarungen - Werden mehrere Primer (PrimU, PrimV, PrimW, PrimX, 
etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fiir eine perfekte 
Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

P s ( Primers )=P S ( Prim U ) 
+(\-P s (PrimU))P s (PrimV) 
+{\-PXPrimU)){\-P s {PrimV))PXPrimW) 
H\-P.APrimU)){\-P x {PrimV)){\-P^ 
+ ... 

(PrimU, PrimV, PrimW... sind hier verschiedene Primer mit unterschiedlichen 
Basenpaarungen) 

und damit als Anzahl der zu erwartenden perfekten Basenpaarungen mit irgendeinem 
der Primer 

N *P s {Primers) . 

FOr die Bestimmung von P a (Primers) auf dem anti-sense-Strang werden die analogen 
Gleichungen verwendet 

Fur das Beispiel mit zwei Primern (einem sense-Primer und einem antisense-Primer) 
ergeben sich folgende Wahrscheinlichkeiten: 
P(AGTAGTAGTAGT) = 0.000000860027 
P(AACAAAAACTAA) = 0.000030005828 

Auf den CpG-lslands, die insgesamt ca. 30.000.000 Basen enthalten, erwartet man 
eine Haufigkeit von Hybridisierungen fur: 
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AGTAGTAGTAGT: 25.80 auf dem sense Strang 

AACAAAAACTAA: 900.17 auf dem komplementar reversen Strang. 

Auf den jeweils anderen Strangen kdnnen die Primer nicht hybridisieren, da auf dem 

sense-Strang durch die Bisulfitbehandlung keine Cs aufierhalb des Kontextes CG 

auftreten und entsprechend komplementar auf dem antisense-Strang. 

Ein Amplifikat entsteht genau dann, wenn bei einer perfekten Basenpaarung auf dem 
sense-Strang innerhalb der maximalen Fragmentlange M ein Primer auf dem 
Gegenstrang eine perfekte Basenpaarung bildet, die Wahrscheinlichkeit dafur ist 

P a {Primers) £^~ 2 {\-P a {Primers))' > 

fur groBe M und kleine P a (Primers) wird dieses durch folgenden Ausdruck berechnet: 

P 0 {Primers) , 

far die Gesamtzahl F der Amplifikate, die durch die Amplifikation beider Strange zu 
erwarten sind, ergibt sich damit 

f - n * p - ifrimm) .o e a :';;;zL), ^ . - 1 P 

i d I D ■ w Formel 1 

d m ■ \ (P s (Primers)) 

^^(^) lBg(1 : P<(i ^ )) [(i-/>,(jw^)r-i] 

F0r das oben angegebene Beispiel ergeben sich fur die CpG-lslands mit 30 Mega 
Basen 3.0498 Amplifikate. Wir konnen jedoch zeigen (siehe Beispiel 1), dass man mit 
Primern, die fur bestimmte Regionen spezifisch sind, mehr als statistisch vorhergesagte 
Amplifikate erzeugen kann. 
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Patentanspruche 

1. Verfahren zur parallelen Detektion des Methylierungszustandes von genomischer 
DNA, dadurch gekennzeichnet, daB man folgende Schritte ausfuhrt: 

a) in einer genomischen DNA Probe wandelt man durch chemische Behandlung an 
der 5-Position unmethylierte Cytosinbasen in Uracil, Thymidin Oder eine andere vom 
Hybridisierungsverhalten her dem Cytosin unahnliche Base urn; 

b) aus dieser chemisch behandelten genomischen DNA amplifiziert man mehr als 
zehn unterschiedliche Fragmente, die jeweils weniger als 2000 Basenpaare lang 
sind, gleichzeitig durch Verwendung von synthetischen Oligonukleotiden als Primer, 
wobei diese Primer jeweils Sequenzen aus an der Genregulation beteiligten 
und/oder transkribierten und/oder translatierten genomischen Sequenzen enthalten, 
wie sie nach einer Behandlung gemalJ Schritt a) vorliegen wiirden; 

c) man bestimmt den Sequenzkontext aller oder eines Teils der in den amplifizierten 
Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide. 

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dafi man die chemische 
Behandlung mittels einer Losung eines Bisulfits, Hydrogensulfits oder Disulfits 
durchfuhrt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, da(J mindestens eines 
der in Schritt b) verwendeten Oligonukleotide weniger Nukleobasen enthalt als es 
statistisch fur eine sequenzspezifische Hybridisierung an die chemisch behandelte 
genomische DNA Probe erforderlich ware. 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, dali 
mindestens eines der in Schritt b) des Anspruchs 1 verwendeten Oligonukleotide 
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kiirzer als 18 Nukleobasen ist. 



5. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, daft 
mindestens eines der in Schritt b) des Anspruchs 1 verwendeten Oligonukleotide 
kiirzer als 15 Nukleobasen ist. 

6. Verfahren nach Anspruch 1 Oder 2, dadurch gekennzeichnet, daft man in Schritt b) 
des Anspruchs 1 mehr als 4 verschiedene Oligonukleotide gleichzeitig fur die 
Amplifikation verwendet. 



. Verfahren nach Anspruch 1 Oder 2, dadurch gekennzeichnet, daft man in Schritt b) 
des Anspruchs 1 mehr als 26 verschiedene Oligonukleotide gleichzeitig fur die 
Amplifikation verwendet. 



. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, daft 
in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
nach berechnet nach Formel 1 aus an der Regulation von Genen beteiligten 
Genomabschnitten, wie Promotoren und Enhancern, stammt, als bei einer rein 
zufailigen Wahl der Oligonukleotidsequenzen zu erwarten ware, oder aber deren 
Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist 
wie berechnet nach Formel 1 , 



F=N *P, (Primers) - Jf " [(I -P a (Primers))"- 1 ] 

logll-P (Primers )) u n J _ 

/p/p . u FormeM 
. x/ r> i n • x \r A Primers)) 

+N*P a (Pnmers) — i-^—— „ [(I -P, (Primers))" -I] 
log(l - P s (Primers)) * " 1 



wobei man die Berechnung wie folgt durchfuhrt: 



bei der mit Bisulfit behandelten DNA kann C nur noch im Kontext CG auftreten, 
so wird angenommen, daft die primare DNA eine Zufallsfolge mit Abhangigkeit 
direkt benachbarter Basen ist (Markov-Kette erster Ordnung); die empirisch aus 
der Datenbank (vollstandig methyliert; mit Bisullfit behandelt) ermittelten 
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paarweisen Basenwahrscheinlichkeiten ergeben sich gleich fQr beide DNA- 
Strange als P bDNA {von;nach) aus der folgenden Tabelle: 



VonVtach 


A 


C 


G 


7 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



mit 



P bDNA (A)=02ZU 
/WC)=0.0140 
P bDNA (G)=0.2199 
P bDN AT)=0A&50 



und fOr den dazu revers-komplementaren Strang (durch entsprechendes 
Austauschen der Eintrage) PrbDm( von '- nach ) 



Von\nach 


A 


C 


G 


T 


A 


0.2729 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 


0.0 


0.0894 



P rbDNA (A)=0M50 
*WO=0-2199 
P riDNA (G)=0M40 
JW2>0.2811 

;damit hangt die Wahrscheinlichkeit, da& sich fur einen Primer PrimE (mit der 
Basenfolge Bi B 2 B 3 B 4 z.B. ATTG...) eine perfekte Basenpaarung ergibt, von 
der genauen Abfolge der Basen ab und ergibt sich als das Produkt: 
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P u ( PrimE ) = P ( B , ) ^SudEllIA P n>Dm(B 2 ;B,) P rbDNA (B 3 ; B A ) 

rbDNA \ u I / * rhONA 

(Bisulfit-DNA-Strang) 

P Sa (PrimE)=P bDNA (B t ) ^^EliiA P ^a(B 2 ;B,) P bDM (B,;B 4 ) 

JW*,) ^W* 2 ) ^(5 3 ) 
(anti-sense-Strang zu einem Bisulfit-DNA-Strang); 
fur einen Primer Prim auf dem sense-Strang ergeben sich 

N*P s {Phm) ; 

perfekte Basenpaarungen - Werden mehrere Primer (Pn/r?a, PrimV, PrimW, 
PrimX, etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fur eine 
perfekte Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

PAPrimers)=P ! (PrimU) 

+(l-P.,(PrimU))P s (PrimV) 

+(1 -P s {PrtmU))(i-P,(PrimV))P t (PrimW) 

Hl-PjPrimU))(l-P s (PrimV))(l-P,(PrimW))P x (PrimX) 
+... 

und damit als Anzahl der zu erwartenden perfekten Basenparungen mit 
irgendeinem der Primer 

N*P ,( Primers) ; 

fur die Bestimmung von P a (Primers) auf dem anti-sense-Strang werden die 
analogen Gleichungen verwendet; ein Amplifikat entsteht genau dann, wenn bei 
einer perfekten Basenpaarung auf dem sense-Strang innerhalb der maximalen 
Fragmentlange M ein Primer auf dem Gegenstrang eine perfekte Basenpaarung 
bildet, die Wahrscheinlichkeit dafur ist 

P a {Primers)^"' 2 ( 1 -P a (Primers))' • 

fiir grofce M und kleine P a (Primer$) wird dieses durch folgenden Ausdruck 
berechnet: 

P a (Primers) 

, noM p , p . V A(\-P a (Primers)) M -\} '< 

log(l-P o (Primers)) " 

fur die Gesamtzahl F der Amplifikate, die durch die Amplifikation beider Strange 
zu erwarten sind, ergibt sich damit 
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F=N*P s (Primers) ^/^^ r , [(1 -PjPr imers)) M -1] 

log (!-/>„ (Pnmew)) Forme| 1 

~ i~ , (P A Primers)) 
+N*P u (Primers) ) >\ - 1-P t (Primers))" -\] 

log ( 1 -P s (Primers)) 



9. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daft in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stammt, die in 
mindestens einer Zelle des jeweiligen Organismus in mRNA transkribiert werden, als 
bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu erwarten ware, oder 
aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so 
hoch ist als berechnet entsprechend Anspruch 8. 

10. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daft in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus nach der Transkription in mRNA 
gespliceten Genomabschnitten (Exons) stammt, als bei einer rein zufalligen Wahl 
der Oligonukleotidsequenzen zu erwarten ware, oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 

11. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daft in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stammen, welche fur 
Teile einer oder mehrerer Genfamilien kodieren, als bei einer rein zufalligen Wahl 
der Oligonukleotidsequenzen zu erwarten ware, Oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 



12.Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daB in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8. aus Genomabschnitten stammen, welche fur 
sogenannte ..matrix attachment sites" (MARs)- charakteristische Sequenzen 
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enthalten, als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu 
erwarten ware, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten 
mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8. 

13. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daS in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stammen, welche als 
sogenannte .boundary elements" die Verpackungsdichte des Chromatins 
organisieren, als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu 
erwarten ware, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten 
mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8. 

14. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daR in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus .multiple drug resistance gene" (MDR)- 
Promotoren oder kodierenden Regionen stammen, als bei einer rein zufalligen Wahl 
der Oligonukleotidsequenzen zu erwarten ware oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 

15. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, 
daG zur Amplication der in Anspruch 1 beschriebenen Fragmente zwel 
Oligonukleotide oder zwei Klassen von Oligonukleotiden verwendet werden, von 
denen eines oder eine Klasse aufier im Kontext CpG oder CpNpG zwar die Base C 
enthalten kann, nicht aber die Base G und von denen das andere oder die andere 
Klasse aulier im Kontext CpG oder CpNpG zwar die Base G, nicht aber die Base C 
enthalten kann. 



16.Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, dafc die in 
Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide durchgefuhrt 
wird, von denen eines eine vier bis sechzehn Basen lange Sequenz enthalt, welche 
zu einer solchen DNA komplementar ist oder dieser entspricht, wie sie entstehen 
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wurde, wenn ein ebenso langes DNA Fragment, an welches einer der 
Transkriptionsfaktoren 



AhR/Arnt 

Arnt 
AML-1 a 

AP-1 

C/EBP 

C/EBPalpha 

C/EBPbeta 

CDP 

CDP 

CDP CR1 
CDP CR3 
CHOP-C/EBPalpha 

c-Myc/Max 

CREB 
CRE-BP1 



CRE-BP1/c-Jun 

CREB 

E2F 



E47 

E47 

Egr-1 
Egr-2 
ELK-1 

Freac-2 

Freac-3 

Freac-4 

Freac-7 



aryl hydrocarbon receptor/aryl hydrocarbon receptor nuclear 
translocator 

aryl hydrocarbon receptor nuclear translocator 
CBFA2; core-binding factor, runt domain, alpha subunit 2 
(acute myeloid leukemia 1; amh oncogene) 
activator protein- 1 (AP-1); Synonyme: c-Jun 
CCAAT/enhancer binding protein 
CCAAT/enhancer binding protein (C/EBP), alpha 
CCAAT/enhancer binding protein (C/EBP), beta 
CUTL1 ; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

complement component (3b/4b) receptor 1 

complement component (3b/4b) receptor 3 

DDIT; DNA-damage-inducible transcript 3/CCAAT/enhancer 

binding protein (C/EBP), alpha 

avian myelocytomatosis viral oncogene/MYC-ASSOCIATED 
FACTOR X 

cAMP responsive element binding protein 
CYCLIC AMP RESPONSE ELEMENT-BINDING PROTEIN 
2, CREB2, CREBP1; now ATF2; activating transcription 
factor 2 

activator protein-1 (AP-1); Synonyme: c-Jun 

MP responsive element binding protein 

E2F transcription factor (originally identified as a DNA- 

binding protein essential E1A-dependent activation of the 

adenovirus E2 promoter) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) 
early growth response 1 

early growth response 2 (Krox-20 (Drosophila) homolog) 
ELK1 , member of ETS (environmental tobacco smoke) 
oncogene family 

FKHL6; forkhead (Drosophila)-like 6; FORKHEAD-RELATED 
ACTIVATOR 2; FREAC2 

FKHL7; forkhead (Drosophila)-like 7; FORKHEAD-RELATED 
ACTIVATOR 3; FREAC3 

FKHL8; forkhead (Drosophila)-like 8; FORKHEAD-RELATED 
ACTIVATOR 4; FREAC4 

FKHL11; forkhead (Drosophila)-like 9; FORKHEAD- 
RELATED ACTIVATOR 7; FREAC7 



WO 01/42493 38 PCT/DEOO/04381 



GATA-1 
GATA-1 
GATA-1 
GATA-2 
GATA-3 
GATA-X 
HFH-3 

HNF-1 

HNF-4 

IRF-1 

ISRE 

Lmo2 complex 
MEF-2 

MEF-2 

myogenin/NF-1 
MZF1 
MZF1 
NF-E2 

NF-kappaB (p50) 

NF-kappaB (p65) 

NF-kappaB 

NF-kappaB 

NRSF 

Oct-1 

Oct-1 

Oct-1 

Oct-1 

Oct-1 

P300 

P53 



GATA-binding protein 
GATA-binding protein 
GATA-binding protein 
GATA-binding protein 
GATA-binding protein 



1 /Enhancer 
1/Enhancer- 
1/Enhancer- 
2/Enhancer- 
3/Enhancer- 



■Binding Protein GATA1 
•Binding Protein GATA1 
•Binding Protein GATA1 
Binding Protein GATA2 
Binding Protein GATA3 



FKHL10; forkhead (Drosophila)-like 10; FORKHEAD- 
RELATED ACTIVATOR 6; FREAC6 

J C f 1 ^^ ption factor 1 - he P atic; LF " B1 - hepatic nuclear 
factor (HNF1), albumin proximal factor 

hepatocyte nuclear factor 4 

interferon regulatory factor 1 

interferon-stimulated response element 

LIM domain only 2 (rhombotin-like 1) 

MADS box transcription enhancer factor 2, polypeptide A 

(myocyte enhancer factor 2A) 

MADS box transcription enhancer factor 2, polypeptide A 
(myocyte enhancer factor 2A) 
Myogenin (myogenic factor 4)/Neurofibromin 1 ■ 
NEUROFIBROMATOSIS, TYPE I 

ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 
responsive) 

ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 
responsive) 

NFE2; nuclear factor (erythroid-derived 2), 45kD 

nuclear factor of kappa light polypeptide gene enhancer in B- 

cells p50 subunit 

nuclear factor of kappa light polypeptide gene enhancer in B- 
cells p65 subunit 

nuclear factor of kappa light polypeptide gene enhancer in B- 
cells 

nuclear factor of kappa light polypeptide gene enhancer in B- 
cells 

NEURON RESTRICTIVE SILENCER FACTOR REST- RE1- 
silencing transcription factor 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR V 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1 
POU2F1; POU domain, class 2, transcription factor 1 
E1A (adenovirus E1A oncoprotein)-BINDING PROTEIN, 
300-KD 

tumor protein p53 (Li-Fraumeni syndrome); TP53 
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Pax-1 


paired box gene 1 


Pax-3 


paired box gene 3 (Waardenburg syndrome 1) 


Pax-6 


paired box gene 6 (aniridia, keratitis) 


Pbx 1b 


pre-B-cell leukemia transcription factor 


Pbx-1 


pre-B-cell leukemia transcription factor 1 


RORalpha2 


RAR-RELATED ORPHAN RECEPTOR ALPHA; RETINOIC 




ACID-BINDING RECEPTOR ALPHA 


RREB-1 


ras responsive element binding protein 1 


SP1 


simian-virus-40-protein-1 


SP1 


simian-virus-40-protein-1 


SREBP-1 


sterol regulatory element binding transcription factor 1 


SRF 


serum response factor (c-fos serum response element- 




binding transcription factor) 


SRY 


sex determining region Y 


STAT3 


signal transducer and activator of transcription 1, 91 kD 


Tal-1alpha/E47 


T-celi acute lymphocytic leukemia 1 /transcription factor 3 




(E2A immunoglobulin enhancer binding factors E12/E47) 


TATA 


cellular and viral TATA box elements 


Tax/CREB 


Transiently-expressed axonal glycoprotein/cAMP responsive 




element binding protein 


Tax/CREB 


Transiently-expressed axonal glycoprotein/cAMP responsive 




element binding protein 


TCF11/MafG 


v-maf musculoaponeurotic fibrosarcoma (avian) oncogene 




family, protein G 


TCF11 


Transcription Factor 11; TCF1 1 ; NFE2L1 ; nuclear factor 




(erythroid-derived 2)-like 1 


USF 


upstream stimulating factor 


Whn 


winged-helix nude 


X-BP-1 


X-box binding protein 1 oder 


YY1 


ubiquitously distributed transcription factor belonging to 




theGLI-Kruppel class of zinc finger proteins 



bindet, einer chemischen Behandlung gemali Anspruch 1 unterzogen wurde. 



17.Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, daft man 
die in Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide 
durchfuhrt, von denen eines die eine vier bis sechzehn Basen lange Sequenz 
enthalt, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie 
sie entstehen wurde, wenn ein ebenso langes DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifuhren kann, einer 
chemischen Behandlung gemafi Anspruch 1 unterzogen wurde. 
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18.Verfahren nach einem der AnsprOche 1 bis 4, dadurch gekennzeichnet, daR die in 
Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide durchgefiihrt 
wird, von denen mindestens eine der Sequenzen (von 5'nach 3') 

TCGCGTGTA, TACACGCGA, TGTACGCGA, TCGCGTACA 
TTGCGTGTT, AACACGCAA, GGTACGTAA, TTACGTACC ' 
TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACC 
TTGCGTGTA, TACACGCAA, TGTACGTAA, TTACGTACA ' 
TACGTG, CACGTA, TACGTG, CACGTA, 

ATTGCGTGT, ACACGCAAT, GTACGTAAT, ATTACGTAC 
ATTGCGTGA, TCACGCAAT, TTACGTAAT, ATTACGTAA ' 
ATCGCGTGA, TCACGCGAT, TTACGCGAT, ATCGCGTAA 
ATCGCGTGT, ACACGCGAT, GTACGCGAT, ATCGCGTAC 
TGTGGT, ACCACA, ATTATA, TATAAT, 

TGAGTTAG, CTAACTCA, TTGATTTA, TAAATCAA 
TGATTTAG, CTAAATCA, TTGAGTTA, TAACTCAA, 

TTTGGT, ACCAAA, ATT AAA, TTTAAT 
TGTGGA, TCCACA, TTTATA, TATAAA 
TTTGGA, TCCAAA, TTTAAA, TTTAAA ' 
• TGTGGT, ACCACA, ATTATA, TATAAT, 

ATTAT, ATAAT, GTAAT, ATTAC, 
ATTGT, ACAAT, GTAAT, ATTAC, 

GAAAG, CTTTC, TTTTT, AAAAA, 
GTAAT, ATTAC, ATTGT, ACAAT, 
GAAAT, ATTTC, ATTTT, AAAAT, 
GTAAG, CTTAC, TTTGT, ACAAA, 

TTAATAATCGAT, ATCGATTATTAA, ATCGATTATTGG , CCAATAATCGAT 
ATCGATTA, TAATCGAT, TAATCGAT, ATCGATTA, ' 

ATCGATCGG, CCGATCGAT, TCGATCGAT, ATCGATCGA 
ATCGATCGT, ACGATCGAT, GCGATCGAT, ATCGATCGC, 

TATCGATA, TATCGATA, TATCGGTG, CACCGATA 
TATTAATA, TATTAATA, TATTGGTG, CACCAATA. ' 

GTGTAATATTT, AAATATTACAC, GGGTATTGTAT, ATACAATACCC 
GTGTA ATTTTT , AAAAATTAC AC , GGGGATTGTAT, ATACAATCCCC 
ATGTAATTTTT, AAAAATTACAT, GGGGATTGTAT, ATACAATCCCC ' 
ATGTAATATTT, AAATATTACAT, GGGTATTGTAT, ATACAATACCC ' 
ATTACGTGGT, ACCACGTAAT, ATTACGTGGT, ACCACGTAAT ' 
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TGACGTAA, TTACGTCA, TTACGTTA, TAACGTAA, 
TGACGTTA, TAACGTCA, TGACGTTA, TAACGTCA, 
TTACGTAA, TTACGTAA, TTACGTAA, TTACGTAA 
TGACGTTA, TAACGTCA, TAACGTTA, TAACGTTA, 

TGACGT, ACGTCA, GCGTTA, TAACGC, 
TGACGT, ACGTCA, ACGTTA, TAACGT, 
TTTCGCGT, ACGCGAAA, GCGCGAAA, TTTCGCGC, 
TTTGGCGT, ACGCCAAA, GCGTTAAA, TTTAACGC, 

TAGGTGTTA, TAACACCTA, TAATATTTG, CAAATATTA 
TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC, 

GTAGGTGG, CCACCTAC, TTATTTGT, ACAAATAA 
GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT, 

TGCGTGGGCGG, CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA 
TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT, 

TGCGTAGGCGT, ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT 
TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA 
ATAGGAAGT, ACTTCCTAT, Al I I I I IGT, ACAAAAAAT, 

TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT 
TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC 
TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT 
TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAAC, 
GTAAATAA, TTATTTAC, TTGTTTAT, ATAAACAA, 
GTAAATAAATA, TATTTATTTAC , TGTTTATTTAT, ATAAATAAACA, 

AAAGTAAATA, TATTTACTTT, TGTTTATTTT, AAAATAAACA, 
AATGTAAATA, TATTTACATT, TGTTTATATT, AATATAAACA 
TAAGTAAATA, TATTTACTTA, TGTTTATTTA, TAAATAAACA 
TATGTAAATA, TATTTACATA, TGTTTATATA, TATATAAACA, 

ATAAATA, TATTTAT, TGTTTAT, ATAAACA, 
ATAAATA, TATTTAT, TATTTAT, ATAAATA, 
GATA, TATC, TATT, AATA, 

TAGATAA, TTATCTA, TTATTTG, CAAATAA, 
TTGATAA, TTATCAA, TTATTAG, CTAATAA, 
GATAA, TTATC, TTATT, AATAA, 

GATG, CATC, TATT, AATA, 

GATAG, CTATC, TTATT, AATAA, 
GATAAG, CTTATC, TTTATT, AATAAA, 
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TGTTTATTTA, TAAATAAACA, TAAATAAATA, TATTTATTTA 
TGTTTGTTTA, TAAACAAACA, TAAATAAATA, TATTTATTTA 
TATTTATTTA, TAAATAAATA, TAAATAAATA, TATTTATTTA ' 
TATTTGTTTA, TAAACAAATA, TAAATAAATA, TATTTATTTA, 

GTTAATGATT, AATCATTAAC, AATTATTAAT, ATTAATAATT 
GTTAATTATT, AATAATTAAC, AATAATTAAT, ATTAATTATT ' 
GTTAATTAAT, ATTAATTAAC, ATTAATTAAT, ATTAATTAAt' 
GTTAATGAAT, ATTCATTAAC, ATTTATTAAT, ATTAATAAAT, 

TAAAGTTTA, TAAACTTTA, TGAATTTTG, CAAAATTCA 
TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA, 

AAAGTGAAATT, AATTTCACTTT, GGTTTTATTTT, AAAATAAAACC 
AAAGCGAAATT, AATTTCGCTTT, GGTTTCGTTTT, AAAACGAAACC, 

TAGTTTTAi l I I I I I, AAAAAAATAAAACTA, GGGAAAGTGAAATTG 
CAATTTC ACTTTCCC , 

TAGTTTTAi MINI. AAAAAAATAAAACTA, GGAAAAGTGAAATTG 
CAATTTCACTTTTCC, 

TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, G G AAAAG AG AAATTG 
CAATTTCTCTTTTCC, 

TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, GGGAAAGAGAAATTG 

CAATTTCTCTTTCCC , 

TAGGTG, CACCTA, TATTTG, CAAATA, 

TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, AG G GTTATTTTTAGAG 
CTCTAAAAATA ACCCT , 

TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, GGAGTTATTTTTAGAG 
CTCT AAAAATA ACTCC , 

TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, AGAGTTATTTTTAGAG 
CTCTAAAAATA ACTCT , 

TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, GGGGTTATTTTTAGAG * 
CTCTAAAAATAACCCC, 

TGTT ATTAAAAATAGAAA, TTTCTATTTTTAATAACA 
TTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAA ' 
T GTTA T TAAA AATAGAAT, ATTCTATTTTTAATAACA 
GTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAC 
TTTGGTAT, ATACCAAA, GTGTTAAA, TTTAACAC 
GGGGA, TCCCC, Mill, AAAAA, 

TAGGGG, CCCCTA, TTTTTA, TAAAAA, 
GAGGGG, CCCCTC, TTTTTT, AAAAAA 

TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT 
TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC 
TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT ' 
TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC 
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GGGGATTTTT, AAAAATCCCC, GGGAAI I I I I, AAAAATTCCC, 
GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, 
GGGGATTTTT, AAAAATCCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAI Mill, AAAAAATCCC, GGAAAGTTTT, AAAACTTTCC, 
GGGAATTTTT, AAAAATTCCC, GGGAATTTTT, AAAAATTCCC, 
GGGATTTTTT, AAAAAATCCC, GGGAAGTTTT, AAAACTTCCC, 
GGGAI I I I I IA, TAAAAAATCCC, TGGAAAGTTTT, AAAACTTTCCA, 
T TTAGT ATTACGGATAGAGGT, ACCTCTATCCGTAATACTAAA, 
G I I I I I GTTCGTGGTGTTGAA, TTCAACACCACGAACAAAAAC, 
TT TAGTA TTAC GGATAG AGTT , AACTCTATCCGTAATACTAAA, 
GGTTTTGTTCGTGGTGTTGAA, TTCAAC AC C ACG AAC AAAACC , 
TTTAGTATTACGGATAGCGTT, AACGCTATCCGTAATACTAAA, 
GGCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGCC, 
TTTAGTATTAC GGATAG CGGT, ACCGCTATCCGTAATACTAAA, 
GTCGTTGTTC GTG GTGTTGAA , TTCAACAC CAC G AAC AAC GAC , 

ATATGTAAAT, ATTTACATAT, ATTTGTATAT, ATATACAAAT, 
TTATGTAAAT, ATTTACATAA, ATTTGTATAA, TTATACAAAT, 

GAATATTTA, TAAATATTC, TGAATATTT, AAATATTCA, 
GAATATGTA, TACATATTC, TGTATATTT, AAATATACA, 

ATAAT, ATTAT, ATTAT, ATAAT, 
GTAAT, ATTAC, ATTAT, ATAAT, 

AATGTAAAT, ATTTACATT, ATTTGTATT, AATACAAAT, 

ATTTGTATATT, AATATACAAAT, GGTATGTAAAT, ATTTACATACC, 
ATTTGTATATT, AATATACAAAT, AATATGTAAAT, ATTTACATATT, 
ATTTGTATATT, AATATACAAAT, AGTATGTAAAT, ATTTACATACT, 
ATTTGTATATT, AATATACAAAT, GATATGTAAAT, ATTTACATATC, 

AGGAGT, ACTCCT, ATTTTT, AAAAAT, 
GGGAGT, ACTCCC, ATTTTT, AAAAAT, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
AGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCT, 
TCGTTTCGTTTTAGATAT, ATATCTAAAACGAAACGA, 
ATATTTAGAGCGGAACGG, CCGTTCCGCTCTAAATAT, 

CGTTACGGTT, AACCGTAACG, AATCGTGACG, CGTCACGATT, 
CGTTACGGTT, AACCGTAACG, GATCGTGACG, CGTCACGATC, 
CGTTACGTTT, AAACGTAACG, AAGCGTGACG, CGTCACGCTT, 
CGTTACGTTT, AAACGTAACG, GAGCGTGACG, CGTCACGCTC, 
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TTTACGTATGA, TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA 
T™CGTTTGA, TCAAACGTAAA, TTAAGCGTGAA, TTCACGCTTAA' 
TTTACGTTTTA, TAAAACGTAAA, TGAAGCGTGAA, TTCACGCTTCa' 
TTTACGTATTA, TAATACGTAAA, TGATGCGTGAA, TTCACGCATCA, 

AA II AATTAA ' TTAATTAATT, TTGATTGATT, AATCAATCAA 
TATTAATTAA, TTAATTAATA, TTGATTGATG, CATCAATCAA', 

TAATTAT, ATAATTA, ATGATTG, CAATCAT, 

TAGGTTA, TAACCTA, TGATTTA, TAAATCA, 

I I I I AAATATTTTT, AAAAATATTTAAAA, GGGGGTGTTTGGGG 
CCCC AAACACCCCC, 

TTTT AAATTATTTT , AAAATAATTTAAAA , GGGGTGGTTTGGGG 
CCCC AA ACCACCC C, 

TTTT AAA l I I I I IT, AAAAAAATTTAAAA, GGGGGGGTTTGGGG 
CCCC AAACCCCCCC, 

TTTTAAATAATTTT, AAAATTATTTAAAA, GGGGTTGTTTGGGG 
CCCCAAACAACCCC, 

GAGGCGGGG, CCCCGCCTC, TTTCGTTTT, AAAACGAAA 
GAGGTAGGG, CCCTACCTC, TTTTGTTTT, AAAACAAAA ' 
AAGGCGGGG, CCCCGCCTT, TTTCGTTTT, AAAACGAAA 
AAGGTAGGG, CCCTACCTT, TTTTGTTTT, AAAACAAAA, ' 

GGGGGCGGGGT, ACCCCGCCCCC, ATTTCGTTTTT, AAAAACGAAAT 
^ G .^ GCG . GGGT ' ACCCCGCCCCC, GTTTCGTTTTT AAAAACGAAAC 
T^TT TTTT ATAAAATAATA, GTGGGGTGATA, TATCACCCCAC ' 
GATTATTTTAT, ATAAAATAATC, GTGGGGTGATT, AATCACCCCAC, 

ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT 
ATTACGTGAT, ATCACGTAAT, GTTACGTGAT, ATCACGTAAC, 

TTTTATATGG, CCATATAAAA, TTATATAAGG, CCTTATATAA 
TTATATATGG, CCATATATAA, TTATATATGG, CCATATATAa' 
AAATAAT, ATTATTT, GTTGTTT, AAACAAC 
AAATTAA, TTAATTT, TTAGTTT, AAACTAA ' 
AAATTAT, ATAATTT, GTAGTTT, AAACTAC 
AAATAAA, TTTATTT, TTTGTTT, AAACAAA, 

ATTT^CGAAAATA CA TTT CCGA AAAAT, TATTTTCGGGAAAT, 

ATTTTTCGGAAATg', CATTTCCGAAAAAT, TATTTTCGGGAAAT 
A TTTC CCGAAAATA, ' 

A^nTCGGGAMTG, CATTTCCCGAAAAT, TATTTTTCGGAAAT, 
ATTTTCGGGAAGTG, CACTTCCCGAAAAT, TATTTTTCGGAAAT, 
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ATTTCCGAAAAATA, 

AATAGATGTT, AACATCTATT, AATATTTGTT, AACAAATATT, 
AATAGATGGT, ACCATCTATT, ATTATTTGTT, AACAAATAAT, 

GTATAAATA, TATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAATG, CATTT ATAC, TATTTATAT, ATATAAATA, 
GTATAAAAA, I I I I IATAC, I I I I IATAT, ATATAAAAA, 
GTATAAAAG, CTTTTATAC, I I I I I ATAT, ATATAAAAA, 
TTATAAATA, TATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAATG, CATTT ATAA, TATTTATAG, CTATAAATA, 
TTATAAAAA, I I I I IATAA, TTTTTATAG, CTATAAAAA, 
TTATAAAAG, CTTTTATAA, TTTTTATAG, CTATAAAAA, 
GGGGGTTGACGTA, TACGTCAACCCCC, TGCGTTAA I I I I I , 
AAAAATTAACGCA, 

GGGGGTTGACGTA, TACGTCAACCCCC, TACGTTAA M ill, 
AAAAATTAACGTA, 

TGACGTATA I I I I I, AAAAATATACGTCA, GGGGATATGCGTTA, 
TAACGCATA TCCCC , 

TGACGTATA I I I I I, AAAAATATACGTCA, GGGGGTATGCGTTA, 
TAACGCATACCCCC, 

ATG ATTTAGTA , TACTAAATCAT, TGTTGAGTTAT, ATAACTCAACA, 
GTTAT, ATAAC, ATGAT, ATCAT, 

TTACGTGA, TCACGTAA, TTACGTGG, CCACGTAA, 
TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, 
TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA, 
TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, 
GACGTT, AACGTC, AGCGTT, AACGCT, 

TGACGTGT, ACACGTCA, ATACGTTA, TAACGTAT, 
TGACGT GG, C CACGTCA, TTACGTTA, TAACGTAA, 
CGGTTATTTTG, CAAAATAACCG, TAAGATGGTCG oder CGACCATCTTA 



enthait, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie 
sie entstehen wQrde, wenn ein ebenso langes DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifQhren kann, einer 
chemischen Behandiung gemaB Anspruch 1 unterzogen wurde. 



19.Verfahren nach einem der Anspriiche 16 bis 18, dadurch gekennzeichnet, dafi die 
zur Amplifikation verwendeten Oligonukleotide auBer den in den Anspriichen 16 bis 
18 definierten Konsensussequenzen mehrere Positionen enthalten, an denen 
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entweder irgendeine der drei Basen G, A und T Oder irgendeine der Basen C, A und 
T vorhanden sein kann. 

20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, daS die zur Amplifikation 
verwendeten Oligonukleotide auSer einer der in den Anspruch 18 beschriebenen 
Konsensussequenzen nur maximal zusatzlich so viele weitere Basen enthalten, wie 
es zur gleichzeitigen Amplifikation von mehr als einhundert verschiedenen 
Fragmenten pro Reaktion aus der chemisch behandelten DNA, berechnet 
entsprechend Anspruch 8, erforderlich ist. 

21. Verfahren nach einem der vorangehenden Anspruche dadurch gekennzeichnet, daft 
die Untersuchung des Sequenzkontextes aller oder eines Teils der in den 
amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide 
gemaft Anspruch 1 c) durch Hybridisierung der bereits in der Amplifikation mit einem 
Fluoreszenzmarker versehenen Fragmente an einen Oligonukleotid- Array (DNA 
Chip) erfolgt. 

22. Verfahren nach einem der Anspruche 1 bis 20 dadurch gekennzeichnet, daft die 
amplifizierten Fragmente auf einer Oberflache immobilisiert und anschlieftend eine 
Hybridisierung mit einer kombinatorischen Bibiliothek von unterscheidbaren 
Oligonukleotid- oder PNA-Oligomer-Sonden durchgefuhrt wird. 

23. Verfahren nach Anspruch 22 dadurch gekennzeichnet, daft die Sonden mittels 
Matrix-assistierter Laser-Desorptions/lonisations Massenspektrometrie (MALDI-MS) 
anhand ihrer eindeutigen Masse nachgewiesen werden und damit der 
Sequenzkontext aller oder eines Teils der in den amplifizierten Fragmenten 
enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide entschliisselt wird. 

24. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, 
daft die Amplifikation wie beschrieben in Schritt b) des Anspruchs 1 durch eine 
Polymerase Kettenreaktion ausgefuhrt wird, in der die Gr6fte der amplifizierten 
Fragmente mittels auf weniger ais 30 s verkurzter Kettenverlangerungsschritte 
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begrenzt wird. 

25. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, 
da(J nach der Amplifikation gemaft Schritt b) des Anspruchs 1 die Produkte durch 
Gelelektrophorese aufgetrennt werden und die Fragmente, die kleiner als 2000 
Basenpaare Oder kleiner als ein beliebiger Grenzwert unterhalb von 2000 
Basenpaaren sind, durch Ausschneiden von den anderen Produkten der 
Amplifikation vor der Auswertung gemali Schritt c) des Anspruchs 1 abgetrennt 
werden. 

26. Verfahren nach Anspruch 25 dadurch gekennzeichnet, dali nach der Abtrennung 
von Amplifikaten bestimmter GrofJe diese vor der Durchfuhrung des Schrittes c) des 
Anspruchs 1 nochmals amplifiziert werden. 

27. Kit, enthaltend mindestens zwei Primerpaare, Reagenzien und Hilfsstoffe fur die 
Amplifikation und/oder Reagenzien und Hilfsmittei fur die chemische Behandlung 
gemaR Anspruch 1 a) und/oder eine kombinatorische Sondenbibliothek und/oder 
einen Oligonukleotid-Array (DNA-Chip), soweit sie fur die Durchfuhrung des 
erfindungsgemafJen Verfahrens erforderlich oder dienlich sind. 
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SEQUENZPROTOKOLL 

ALLGEMEINE ANGABEN: 
ANMELDER : 

NAME: Epigenomics AG 
STRASSE: Kastanienallee 24 
LAND: Berlin 
POSTLEITZAHL: 10435 
TELEFON: 030-243450 
TELEFAX: 030-2 4 34 5555 

BEZEICHNUNG DER ERFINDUNG: Verfahren zur parallelen Detekti 

des Methylierungszustandes von 
genomischer DNA 

ANZAHL DER SEQUENZEN: 31 

COMPUTERLESBARE FAS SUNG : 

DATENTRAGER : Di s ke tte 
COMPUTER: IBM PC-komtatibel 
BETRIEBSSYSTEM: PC- DOS /MS- DOS 

DATEN DER JETZIGEN ANMELDUNG: 

ANMELDENUMMER: nicht bekannt 
ANMELDETAG: 6 . 12. 2000 

ANGABEN ZU SEQ ID-NO: 1 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 12 Basen 
ART: Nukleinsaure 
ST RANG FORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 1: 

AGTAGTAGTA GT 

ANGABEN ZU SEQ ID-NO: 2: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 12 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 2: 

AAAACAAAAA CC 

ANGABEN ZU SEQ ID-NO: 3: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 973 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 



WO 01/42493 



2 



PCT7DEO0/04381 



ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 3: 



AGTAGTAGTA 
TTTTAGTAGG 
ATATTTTTGT 
TATGTTTGAG 
GTGATTTATT 
TGAAAGTGGA 
TTATTTTTAG 
TGAGCGGAGC 
TAGAGTCGTC 
GGCGGGGAGG 
TATTTTTTAG 
GTGGAATCGT 
GGGTTCGTAG 
TTGCGGGTTT 
TTTGCGGGGT 
AAGATTGTAT 
GGGTTTTTGT 



GTAGCGTTTT 
AGTGTTTTTG 
AAAATTTTAG 
TTGTTTTATA 
GAAAGGCGAT 
CGTAGTTCGG 
TTCGGTTTTT 
GTTTCGGGGT 
GCGCGTTTAG 
CGTCGAGGGT 
GCGGTAGGCG 
ACGTGTTTGG 
TGGGATTCGC 
CGTAATTATT 
TTTTTACGAA 
TTTTGTTTTG 
TTT 



TGAAGTTTTT 
GGGAGGGAGT 
GAATTATTAG 
TAGTGTAGAA 
GCGCGTTTTT 
TGTTAGGTGT 
AGATATTTTT 
GTGAGGAGAA 
TTTCGTTACG 
AGTTAAGGGG 
TATGCGTATT 
TTTTGTAGTT 
GGAGAGGGGC 
ATTCGTGATA 
TTTATTATAT 
TAAATTATTA 



TGTGGAAGGT 
GAGTGGGAGA 
TATTTTATTT 
ATTGAGAATG 
TTTTTGTAGG 
TAGCGATTTG 
CGAGGCGTTT 
TCGGTAAATT 
TTGGTTGTCG 
AGTAGGTTAC 
TTTTATTTGC 
AGGGGTTTTT 
GCGGCGGGGC 
ATTATAGTTT 
TTAATATTCG 
GTTTCGTAAT 



GAGAAATTTA 
TTAGAAATGG 
TTTTTTATAA 
TAAACGTGTA 
TAGAATTGTT 
AGTTCGTTTT 
TTTTTTGTTC 
TTCGCGGGCG 
AGCGTATTTC 
GTGAGAGGAG 
GTTTCGGTCG 
GGTTCGGGGC 
GGAGCGTTTG 
TTGGAGAGTT 
TGAATTTAGA 
TTAGAATTTA 



TCGATAAGTT 
GGTCGGTGGA 
AGATTGTTTT 
AACGATCGGT 
TTAGGAAGTA 
CGGGTTTTAT 
GTTCGATTTT 
TTGGGCGTCG 
GGTTGCGTTC 
GAGTTTGATT 
GGAGGTTTAC 
GCGTAGGGGC 
GAGATTTAGT 
GTTTAGGTTT 
AATTAAGATA 
TTTTGTAAAT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
973 



ANGABEN ZU SEQ ID-NO: 4: 

S EQUEN ZCHARAKTERI ST IKA : 
LANGE: 1890 Basen 
ART: Nukleinsaure 
ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 4 : 

AGTAGTAGTA GTTAAGTTTA AGAGTGATAT TTTTTTAGAT ATAGTATAAT ATTGTTTTTG 60 

TAAAAGGTTA TTTATATGAA TATAATGTTT TTTGGGTTAA TTAATTCGTT TTGAGAATAG 120 

TTAGGTTAAA ATTTTTAGGT TTTTTATTTT GGGTTATTTA AGTTAGGATC GCGACGTGAG 180 

TTCGGGGTGA GTCGAGGGGT ATTTCGGGTC GAGGTTATTC GAATCGAAGT TATGAGGCGC 24 0 

GGGTCGGTAA TCGGAAGTGG TTTAGGGAGA GTTGTACGAG ATTCGGGGGT TGTGATTTGG 300 

AAATAAAATA AAATAAAATA AAATTTTAAT TGTTTTGGGA TTGATTTTTA AAAGAGCGTT 360 

TTTTTGGTTT AAGAGGTCGG CGTTCGCGGA GATGTCGTTT TAAAGGGTTG TTTTTTAAGC 4 20 

GTGTAGGTCG CGTACGGGTT TTTTTAGCGG GCGGGTAAAA TGGGCGTCGG TATTCGGGAG 4 80 

GCGTTTGTTT AGGCGTTCGG GCGTCGTTTA TAGAGTACGT TCGTTTGCGG TTTTAGAGCG 540 

TCGTTTTTTT GTCGTTTTCG TCGTTCGGTT TGACGTTCGG ATCGCGGTCG GTTATCGTTT 600 

TTCGTTTCGA CGGTTACGTT TGTTTTAAAT CGCGCGGGCG TTTTTTAGGT GTTGTTGGGC 660 

GGGTTTCGTT TTCGTGTTTT AAGGTTCGTT TTCGCGCGTT AGTCGCGCGT TCGTTGTTTT 720 

TTTTTCGTTT TTATAGTTTC GTTTTTATAG TTTCGTTCGT TTTTTAAGTT TCGTTTTTTA 780 

GGAATTCGCG CGTCGAAGGT TAGGTTTGGG CGGAGCGTAT AGCGTTGGGC GTTGGGGAGG 84 0 

TTGCGTCGTA GTATTCGGTT GGTTAGGATT AAGTGGGTTC GAGGCGGACG TGAGAAGGGT 900 

CGGGTTAAGA TGGCGGTGTA GGTGGTGTAG GCGGTGTAGG CGGTTTATTT CGAGTTTGAC 960 

GTTTTTTTCG TTTGTTTTAA TTACGTTTTG AGTATAGAGA AGGAGGAAGT AATGGGGTTG 1020 

TGTATAGGGG AGGTGAGTAG GTTTGTTAGT TTGGATGGAA TTTTGTTGAG TAGTTTTAGT 1080 

GTGTTTTCGG GGTGGGTGTC GGTAGTTTTT AGGGTTGCGG AGGTTATAGG TATTTTCGAT 114 0 

TTAGGTTTTT GGATATTTTT TATATAGTTT TGTCGCGGGG AGTTTCGTTT TTTTTGGTCG 1200 

TTTGATATTT GTTTAGTTTT TTGCGAGTTT TCG'GCGGTTT GTATAGGTTT CGGGAGTTTT 12 60 

GTTTTTTTTT TTGTAGTTTG GGGTTTTTTT TTAGATTTGC GTTTTTCGTT CGGTTGATTA 1320 

AAATTGTAAG GTAGGTTAGA AAGATATTGG AGTATAATGA GGATGTTCGG GTATTACGAC 1380 

GTAGTAGTTG ATTATAGTTA GAGTTTTTTG TTTCGTTTCG AGTTTTTTGT TTAGGGAGTA 14 4 0 

GAGATATTAA TTAAAGTATT TGAAGGGTAT CGAAGAGTTT AATAGAAGGT GCGGGGTTTG 1500 

AAGGAAGTAA AAGTTTTCGT TGTATTGTGT TGAGGAGGGG TCGAAGAGGA TGAGGAAATA 1560 

TAGTTTAGTT GTTTATAGTT TAAAGTAATT TTTTAGTTTT TTATATTATG TGCGTGAATA 162 0 

TATGATTTAA TTGTTATATA ATTTGTATTT ATATATGTTA AATAAACGTA ATGTGATTAA 168 0 
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TAATGTTTTT TGTTTTTTTT TATTTTAGTT GAACGATGAT ATAAGGTAAG ATTGTATTTG 

TTTATTTATA TTTTATAATT TTTAAGTTAT TGTTAATTTA AAATTATGGC GATTTTGGTA 

GTATTGTGTT CGGATCGTGT TTTAAATTAA TTATTATTAT TATTTCGGGG TTTTTTTAAT 

GATATAATTT TGAATTTTGG TTTTTGTTTT 

ANGABEN ZU SEQ ID-NO: 5: 



SEQUENZCHARAKTERISTIKA: 
LANGE: 2222 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG : SEQ ID-NO: 5: 



AGTAGTAGTA 

TTATTTTTAN 

GGGGGGTGTT 

GGTGTTTCGG 

CGGCGGTCGA 

CGTTTTGTTA 

GTCGGTTCGG 

TTTTCGTATT 

GGTTTTATTA 

TGCGTTTAGG 

TNNTTGNNAN 

GGCGATTGGG 

AGAGTCGGAG 

GAGGGAGAGA 

GAGTCGTGAC 

GGGGAGGGTA 

TCGCGAGCGT 

GGCGAGTTTT 

TTTTTGCGTG 

TGGCGGAGTT 

GGGAAGGAGG 

AGCGAAAGGG 

TAGTTTTAGG 

TtGCGAGAGG 

TTGTACGGTT 

ATGAATTGGT 

TAGTTCGAGG 

AAAGATTTTT 

TTATTAGTTT 

TAGTAGAGTT 

GAAATTATAT 

TTAGGAGAGG 

TTTTTTATAA 

GTGTGTGTGT 

ATAAAGTTTT 

AATGATTTTT 

GTATGTATTT 

TT 



GTTTTGGAGA 

AGGATTTTAG 

TACGTGGAGG 

GGGTCGATGT 

GTAGTAGAGG 

GTAGTCGTTT 

GTTTTTGGAA 

CGATTCGGAC 

TTTTGTTCGG 

TTGGTTCGTA 

TNTTTTTTTA 

TACGCGAGGG 

AGCGCGGGAG 

GGGGGCGAAG 

GGATTTATTG 

GAGAGGGAGG 

CGTATATTCG 

GGTTGGGGAA 

TAGGGTGGGG 

TTTTCGGTTA 

AAATGCGAGG 

GGATAGGGGT 

GTGTTAGAAT 

TAGTTAAAGG 

TATTAGGATT 

AGAGTTAGGA 

CGTGGGGAGA 

TATTTAGTTT 

TTGTTTAAAA 

ATATTTATTT 

TTAGAAAAGT 

TGTGATGAGG 

GTTTTGATAA 

GTGAGAGAGA 

TGAGTTATTT 

ATATGAGAAT 

TTTTTTAATA 



GTAAGTGGGT 

AATATTTTCG 

AGGGTCGCGA 

CGGGCGGGAT 

GGCGTTTCGT 

CGTCGTTTTT 

TTTTTTACGG 

GGCGGTAGTA 

CGGGTCGGCG 

GGAAACGGCG 

TAGGGGAGGG 

AGCGGGTAGG 

GAGTAGCGGC 

ACGGTCGGGA 

TAGCGGTCGC 

GGAAAGCGGA 

GGAATTTGTN 

NTTTGAGCGC 

GGAGGTTAGG 

TGTGGTTGGA 

GTTTTTCGGC 

TTTGGAGTGG 

TATTCGGATG 

TATTTGTGTA 

GTTGTTATTT 

ATTAGGTTGT 

ATTTGGGTAA 

TGTATTTTTA 

AAAGAAAAAA 

TTGTGGTAAT 

ATAAGGAGGA 

ATAACGAAGA 

TCGTTCGTAT 

GAGAGAGGAT 

TATAAAAAGT 

TTTATTTTTT 

AACGTTTAGC 



TTTATGTAAA 

AATTCGAAAA 

GAAGGAGAGT 

CGGCGGCGCG 

AGAGGTCGGG 

TTCGGTTCGT 

GGGATAGTCG 

GGGGGAGGGA 

GTTCGTTGGT 

GCGGCGGTTT 

GTAGGCGGTT 

GTAGGGGGAA 

GAGAGGTAGG 

AATTCGGGGT 

GTTGATTCGT 

GTGTTGTAGC 

GTTTCGTTGC 

GCGGATTACG 

GGCGGGGGCG 

GGCGGGCGGG 

GGGAGGAAGC 

AAGTTTTGCG 

TCGTATTAAA 

TTCGTGTATC 

CGGTGTAGTA 

AAAGATAGAG 

ACGAGGAGAA 

TAAATCGTTT 

ATTCGAATGT 

TATTTTTTTA 

AATTTATGTT 

AAATATTTTG 

TCGTGTGTGT 

GTTTTTTGAG 

TATTGTGTTG 

TTATGTGTTA 

GATTTGTTTT 



GTGTTATTTG 
TAGAGTGAGT 
GCGTCGGGTT 
GGGGTGGGGC 
GGGGGCGCGG 
TCGTAATCGT 
ATCGGGGGCG 
TGGTGTATCG 
TCGTTGGTTC 
ANTTNTANTT 
CGCGGGTTTC 
ATAAATTAAG 
AGAGGTAGAG 
TGTAGTTTCG 
AATTTTAAGG 
GTCGGGGCGG 
GGGCGAGTGT 
TTCGTTTTTT 
CGGACGTCGG 
GAAGAAGGTA 
GCGAGGGGTG 
GGAGAGGAGG 
AAATAGGAAA 
GATTTGGATT 
TTCGTAGGTT 
AAGCGAGTTA 
GGGATATTTT 
AGATTTTTTT 
AGATTGTTCG 
GAAAATTTAG 
CGAGAGAAGA 
TAATTATTTT 
TTGAGAGTGT 
TGATCGGAAA 
TTTTTTTTTA 
ATTATTTTTT 
AGGATTAAAT 



TTATATATTG 

GTGGAGGGGA 

GATGGTTAGC 

GACGGCGGGG 

GGTTTCGCGT 

CGCGGGATTC 

TCGGGGTTCG 

AGGAAGTTAA 

GGAGAAGTGT 

TTNNNNTTNT 

GCGTCGGTCG 

GTCGAGATTT 

AAGAAGAAAG 

CGTCGCGTCG 

TACGAAAAAA 

GGGCGGGTTT 

CGCGTGTTTT 

AGTCGGTCGT 

TGACGTCGCG 

AGGTTGGGAG 

CGCGAGTGTT 

AGTAGAGGAG 

AATTTAAGTT 

TATTATAGAA 

TATTTGTAAT 

AAGTTGGTCG 

TTATTCGTAG 

TTGGCGGAGT 

TTTATTTTTT 

ATTATAATAG 

AATAAAGTTG 

AATTAGTTAT 

GTGTGTGTGT 

TTTTTTATTG 

AAAAAGTTTT 

TATATGATGA 

GGTTTTTGTT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2222 



ANGABEN ZU SEQ ID-NO: 6: 



SEQUENZCHARAKTERISTIKA : 
LANGE: 307 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
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TOPOLOGIE: linear 
ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 6: 



AGTAGTAGTA GTTTCGTTAC GAATACGATT AGTTTATATT GGTTGTTTAG TATTTCGGTT 60 

AGTTTTTGTG GGACGTTGGC GCGTATATCG TTTCGTCGGG GGGTCGGGGA TTTCGGGGAT 120 

TTCGGGGTCG AGGACGAGGG AGGCGAGTAG GTCGTTGGTT TCGACGATTT TGCGATCGAG 180 

GCGTTTGTAG TTGTTCGGGG CGAGGCGGGC GATTTTAGGT TTTCGAGTAT TTTCGAGATA 240 

TTCGCGTTAA GTTTGGTTTC GGGGGTGGTT GTCGTCGGGT TTCGTTTGCG TTTTTGGTTT 300 

TTGTTTT 307 



ANGABEN ZU SEQ ID-NO: 7: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 523 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 7: 

AGTAGTAGTA GTTGTTGTTG TTCGAGGTTT CGGTGTAGTT GGAAGTTTTG GAGGTGGGGA 60 

GAGGGATGTT AGGTAAGTGG TACGGCGAGC GTAAGGGAAG GGGTTAGTTA TTGATTAGCG 120 

GTAGTAATTG TAGGAATCGT CGTCGTAGTT GTAGTCGTTT TTTCGTTCGT TTTTTCGGGT 180 

TTTCGGGAAA ATGGTTGTGG GGTTGGTCGC GTCGTTAAGT TTGTTTTCGC GCGGTGAAGA 24 0 

GCGGGTTGTT TGGGGGAGTC GTTTTTTAAT TTCGCGGCGC GTTTATTTTT GCGGAGTTCG 300 

TGGTAGGATT CGAGGGGTTA CGAGTTGATA TTTTTTTGGG TTGTATAAAA AGTTGAGGCG 360 

GGCGTTGGGA GGAGGTAGCG GTTGTTGCGG TGCGGTTTTT TTTTTTTTTT ATATTTTGTT 4 20 

CGGGTTATTT TTTTTTTTTT TTTTTTTCGT TTTTCGTTTT TTTTTTTACG CGGGTTTTTC 4 80 

GGGGTTTTGG CGGTTTTCGG TTGAAGGTCG CGGTTTTTGT TTT 523 



ANGABEN ZU SEQ ID-NO: 8: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 653 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 8: 



AGTAGTAGTA GTAGCGTCGG GAGTTCGCGT AGAAACGATT TGATTTTTCG CGGCGTTATT 60 

TTTTTTTGGG ATTGGCGTTG CGCGGAGAAA ATTTAGTTTG TCGATGTTTC GTTTATTATT 120 

TCGTTTTTAT TTATCGCGCG GTTTTTTGGG AATTGTAGTT TTTTCGTGAG CGGTCGGTAG 180 

CGGCGAGGTC GTCGGCGGAT TTTAGCGTTT AGGAAGTTTT GCGTAGGCGT AAGCGTTTTT 2 40 

TAGGTAATTA CGTCGCGGTT CGAGGTTGTA GATTTTGGTA GGGGATATAA TTGGAGAATG 300 

AGGGTGGTCG GGTGGGAGTA GGGATTAGGT TTTATTTAGA GTTCGGAGTT TGGAGTTCGT 360 

ACGATTCGAG GTTTTTTTTT TTTTTTGTTT TATAGAAAGA GCGGAAAGTT TAAGAATCGG 4 20 

GTCGCGTTTG GTTGAGTTTG ATAATGTTTC GGTTTTACGC GTATTGACGT CGATTTTTGT 4 80 

ATGTTTAGTG TCGTTGCGGG GTTGGTATTG CGGTTCGGGT TTGGCGTTGA GGAGTTTGGT 54 0 

TTAGTTCGTT TTTGTTTTTC GCGGAGCGTT TGGTCGTGGG TAAGTTTAGG TTAGGTTGTT 600 

TCGGGGACGT AGGGTCGCGT AGACGTTTTT TTACGTTTCG GGGTTTTTGT TTT 653 



ANGABEN ZU SEQ ID-NO: 9: 



SEQUENZCHARAKTERISTIKA: 
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LANGE: 14 61 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 9: 



AGTAGTAGTA 
ATTTAGGTTT 
GCGGTCGTTC 
GGGTTTGTCG 
TTTCGGGTTT 
CGGGTAGCGG 
GATACGCGTT 
TTTGCGTTTC 
GATTGGTTAG 
GTGACGATGA 
TACGTATATA 
CGGGAGAGGG 
TGTTTCGTAG 
TAGTTTCGAT 
TTATATAGTT 
AAAAAAAAAA 
TAGTTTTTAT 
GTTGGTGGTC 
ATTATTAGAT 
TATATTAAAT 
AAATAATTTT 
ATTTGGTTTT 
TTGTTTTTTT 
TATTGTATGA 
GATAGGAGTG 



GTAGGCGGTG 
TACGGTCGAG 
GTTTAGGATG 
ATACGGCGGG 
TCGGTATTAT 
GGGCGGCGAG 
TTCGGGCGTT 
GTTTTTTCGG 
GTTTCGCGGG 
TTGGTGTTAA 
TTTTATTCGA 
TTAGTCGGGA 
AGATTTTCGG 
TTTTTTATTT 
AAGGGATTTG 
AAAAAAAAAA 
TGATGAGTTT 
GAGTGCGGTA 
ATATTTATAT 
TTTATTATTA 
AAAAAGGATA 
GTTTGAAATA 
TT T TTT TTTT 
TATTTAAAAA 
GTTTTTGTTT 



GTTAGGTCGG 
TTTTTGGTCG 
GAGAGGCGGG 
GTTCGGTGGT 
GGTTATTATC 
GAGGTTATGG 
ATCGGGCGTT 
TACGGTCGGC 
TCGGGTTTTA 
GTTCGGGCGA 
GGAGTCGCGT 
GATTTTAGAT 
TTAAAAGAGA 
ACGATAGGGG 
AATTAATTTA 
AAAAAAAATA 
TATTATTTTA 
AAGAAGTTAG 
TTATATACGT 
TTGTTTGTAG 
AAAAAATTAA 
ATAAAAGAAG 
TTTTATTTTG 
GAAAAAAAAA 
T 



GTCGGGCGGT 
GAGATCGGTC 
TTTTAGGTTC 
CGGTATTTGG 
GGGGTTTCGA 
TCGGGGTTTA 
CGTTTAGGAT 
GATTTTTTAA 
GGAAGGGTTT 
GGTGGCGTTC 
AGAGGTCGCG 
TTTGGAGAGG 
TTTTTTTGGG 
TTTTCGGGTG 
GTTATTTTTG 
TTTTTAAAAG 
ATTGAATTTT 
AAGGAATTAG 
TTTT AG AT AT 
AAATTAATTT 
TGATTGAGAA 
AAGAAAAATT 
TTTGAAAATC 
ATAAAAAAAA 



TATTAGCGGT 
GTTTACGGGG 
GGTTCGGAGC 
TTCGTACGTG 
TTACGACGAG 
CGACGCGTTA 
TTTTCGGGTT 
CGGTTATTAT 
GTACGAATTT 
GTTCGGTTTT 
GGGGTTTAGT 
TTAGGGTTGG 
TAGTTACGGC 
GGAGGTAGGG 
GAGAATTTTG 
AAAAAACGGG 
TTTTTTTTTT 
AATTTTAGTG 
ATATAAGAGT 
AAAAAAATAA 
AAGAGGTATT 
TATTATTATT 
GTGGGTTTGG 
GTTGAATTAA 



TTTCGGAGGT 
GGTTATAGTA 
GAGTTTTTTA 
TTCGAGGGGT 
GTCGATGGTT 
TTTTTCGTAC 
TCGGGTTCGG 
TCGGCGTACG 
TATAGCGAGA 
TTACGTATTT 
ATAGAGGGTT 
GTTATAAGGG 
GTTTTTTAAT 
AGTAGATAAA 
GGGAATATGA 
GAGAAAAAAA 
GATGAAGATA 
TTTTATATTT 
GTTTGTCGGT 
TAATAATAAT 
TTTTTTTGAT 
ATCGATTTTT 
GATTGTGAAT 
AGGGTTTTTG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1461 



ANGABEN ZU SEQ ID-NO: 10: 



SEQUENZCHARAKTERISTIKA: 
LANGE: 2536 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEK0LS: chemisch vorbehandel te Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 10: 



AGTAGTAGTA GTAATCGGGT CGTCGTCGTC GCGGGGTTAA GAGATTACGT TTAGTAAAAA 60 

TTTTTTTAGG AAAGAGGTTC GAGAGTTTTT TTTTTATTTC GTTAAGGGTG TTGATTTTGT 120 

CGCGTTACGT TACGTATTAA AAGGTTCGCG AAGAAAAACG CGGGCGAAGT TTAGTATTTT 180 

CGAATAGAAA GGGAATTTAT TTTAGAAGGG GGGTTTACGG GTTTGAGGGT TTTTGGGTGG 24 0 

GGAAAGTAGT ATTGGAGGGA GAAGATAGAA GGGATGGTAA GATAGAGGAA ATTACGGGGA 300 

TAAAAAGGAA GGGATGAGGA GTTTTTTTAT TATAAAAGGG ATTGACGGAC GGGATGTAGA 360 

GTAATGGGTT TTTTTCGAAA AATGGATTGG TAGGTTTTTT CGTATTTTTA AATAATTTCG 4 20 

TATTATTTGA AAGCGGGGAG TTTGAGTTTG GGGTTGCGTA GATTAAAGTA GGGTAAGACG 4 80 

AAGGGAAAGA GGGAGGGGAG TTTGGAAGTA AAGTGAATAA AGAGGTAAAA GAGGTAAAGT 54 0 

TGGAAATGGA AACGAGAAAG GGAGTTGGAA AGGGGTCGTT TTGGAAGGGT TTTGAAAAAG 600 

GTTTAGAAAT GGGATGTTGG GGAGGTAAAG GGGGATAGTT TCGAGGAAGG GTATTTTAGG 660 

AATGTAAGGG AGCGTTTTAG GTTTTGGGAA GAGGAAGGGA TGGGAGGGCG GGGAGGTAGT 720 

CGAGGTTCGG GAGTTGGAAT AGAGGGGGTT TTGCGCGGGG TTTAGGAGGG GAGAGTAGGG 780 

TCGGAGGGAG GCGATTATCG CGGGAAGAGT TAGAGGATGG GAGGGAGGGG TGTTGCGGTT 8 40 

GAAGAGGGGA TGTGGATTTT TTTAATGTTA GGGAGAAGAG GGAGGTGAAG CGAGATAAAA 900 
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GGAAAGGGGC GAATAGGGAG AAGAGGAAGG AGTTTGCGAC GCGATGGGGG AGGGGAGGGA 960 

GGTCGTGGGA AGCGGTCGGG GGGCGCGGGG ATGGGAAGGG GTCGGGCGGG CGGCGTGGTT 1020 

ATTTTAGGTT GCGGATTTTT TTTTTGGGGA GCGGCGTTGT CGGCGGGCGG GTTTCGTAAT 1080 

TTTTCGGTTT TTTCGTTCGT TTTTTCGTTT TTTTCGGGCG GCGGCGGGGG TCGGTACGGT 114 0 

ACGGTTTATA GCGGCGGTTT TTTTGCGTCG AGTTTCGGAT GTTGTTTTTG GGGAGGCGGA 1200 

GGTAGCGGTA GCGGTAGCGG TTCGGTTCGT ACGGTTATTA TCGTTCGCGG TAGTAGGCGT 1260 

TCGCGGGTCG AGTTTTTTAG TAGTCGGCGT CGGCGTCGGC GGCGGCGGCG GCGGCGGTTA 1320 

TGGTTTTTTG CGTTTGTTTT TTTCGTTTTC GGCGTTTTGC GGCGGTCGCG GTTCGATTTT 1380 

CGTATTTTGC GTTTGCGCGC GGTTTAGTTA GCGCGGCGCG TTTTTTTCGC GCGCGTTCGC 14 4 0 

GTTTATTTAT AATCGCGTTC GCGGAGTGTT TTTCGTATCG TTTTCGGTGC GTGGGCGGGA 1500 

GATATAAGTT TAGTTAAGTT TATATAGTTC GGTTCGGGTG GTTATGGAGA GGCGTATTGT 1560 

AGAGATATTT GGACGCGTAT TGTGATAGGC GTTATTTTGA TATACGTGTT TTTTTATTTT 162 0 

TAAATATTAC GGGTCGTAAG CGTTTATATT TATATTTATT TGTAGGGATT ACGTGGGAGA 168 0 

ATTTGAAGGG TTGATTTTGT 'TTCGGTGTAT TCGTAGTAGT AATGATGCGA GAATTCGTTT 174 0 

TAATTTCGTT ATTGATTGGA TTAGATTGTA AATTTTTTGG CGTTTGGGAT GGTTTAGTCG 1800 

TGTTTAGTAT TAAGTGTAGG TATTTAAATT TTTGTGGAGT AAGTGATTGG ATGAATGAAT 1860 

GTATTGGAAT TGTTTATTGA GTATTTGTAA TAATTTTGAT TTTATGGTTT GGTATAAAGA 1920 

ATTTTATTGT AGTATGAAAT TAAATGGTGT TTGTGTGTTT GTTTTGTTTT GGTTTAAGGT 1980 

TTAAAATAGG TTAATGTATG TTTTTTTTTT TTTAACGTAG AGGAGTTTTA TTTTGTTTTT 204 0 

GTGTTAGTTT TTATTATAGA ATGCGTAATT TTATTTTAAT TTAAATGTTT ATATTTTTTA 2100 

GGGTAGGAAT TGTTGTTTAG AATATATAGT TTGAAGTATA TTGTGTGTTT ATATAACGAT 2160 

AGTTTTTTGG GTTTGGTAAG ATTTTTTATT TTTTATTTGT TTGTTATTTT GTTTTATTAC 2220 

GATTTTTTGT AATTTTTATT TTTATTTTTT TTGTTTTTTA TTATTATTAA AATTTTTTTA 2280 

TTGTTTTTTG TTTTTTTTTT CGTTAGTTTT TGGGGAGTTA GTTGTTATGA GTATTTAGTT 234 0 

TGGTTTTAGA TGTTGAAAGG GTTAGTGTAT ATAGAAGATA TATATTTAGT GATGGGTAAG 2400 

ATGTTGTAAT TATATTGGGT TATGTTGAAA TTGTGAAGTT TTAATTTTTT TATGTGTAAG 24 60 

AGAAATTAAT GTATTGTAAT TTCGATGTTT GTGTTGAGGA TTTTTTTTGT AAATTTAAGT 2520 

TTTTGGTTTT TGTTTT 2536 



ANGABEN ZU SEQ ID-NO: 11: 



SEQUENZCHARAKTERISTIKA: 
LANGE: 504 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKOLS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 11: 



AGTAGTAGTA GTAGCGCGTT GAGTTCGGTT ACGTAGAGCG TTAGTTCGGT GCGGTTTTGT 60 

AGGTCGGCGC GCGTGAGTAG CGGTAGCGCG AGTATCGAGG CGTTTAGTAG GAAGGTGGCG 120 

AGGTTGAGAC GCGTTTTAGA GTTCGGCGGA GTTCGCGTCG CGTAGTTCGT TATGGCGTCG 180 

GGCGGCGGAT TAGCGGGCGG CGGCGTCGGT TGTAGTTCGG AGAAACGCGT CGGTTGCGTT 240 

TGCGTATTGT GTCGTCGATG TCGGTTCGGG AAGGGTAGTT GTTCGTAGTT GCGCGTCGTT 300 

TGTTAGTTTT CGCGAGAATT TCGGTTCGTT TTGTTGTTGT TCGGAATTTG GCGGGAGCGT 360 

TTCGTTCGTT CGTTTTTTTT CGTTTTTCGG GGATATTCGG GTTTTGAGTT AGATTTTGTG 420 

TCGGGCGGGG GTCGGGAAGT GGTGGGAGAA GTCGTCGTTC GCGTTTGTTT AAATTTAGTT 4 80 

TTAAATTTAG GAGGTTTTTG TTTT 504 

ANGABEN ZU SEQ ID-NO: 12: 



SEQUENZCHARAKTERISTIKA: 
LANGE: 2036 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 12: 
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AGTAGTAGTA GTTTTAATTT GAGTTTAGCG TATTCGAAGT TTCGTTTACG TTTTTTTTTT 60 

TAGAGATTTT TAAGTCGGAG GAAAATAGCG TAGTGTCGGT TTTTAGTTTA GTCGTTG T TT 120 

TTTCGGTTTT TAACGGTTCG GATAAGATGT AGATGGAATT ATCGTTTTTG TTAGGTTTGA 180 

GTTTTTATTA GTTTTTTTAG TAGTCGTCGT CGTTTTAGGA GTTCGCGGTA TCGGGCGCGT 24 0 

CGTTGTCGTC GTTTTTCGGT AGTATTTGGT TTACGGGTAT TATTAACGCG GTAGAGGATA 300 

GTTTTTTTTA GGGGATTATT TTAGTTAACG GGATTATGTT TTTTTAGAAT TTTTCGTATT 360 

ATGTTAATTT AGTTTTCGGA GGTATTTTTT TTTCGTAGAT CGGTTTGGCG TAGATTTAGT 4 20 

ATTATTAGTA GTCGTCGTCG TTTGCGTTCG CGTCGTAGTC GGTATAGTTA GCGTAGTTAT 4 80 

TATAGGCGTA GTTTTCGTAG TAGCGTCGTT TATTCGTTAG TTTTAGTTAG GCGTTTTACG 54 0 

CGTAGAGGAG CGTCGTCGCG GCGTACGGTT ATTAGTTTAT TATGATTAGT AAGTCGTTTT 600 

CGTTTTCGGC GGTTGTAGTC GTTGTTGTCG TAGTCGTCGT TTCGTCGGTT TCGTTTAGTT 660 

GGAATACGTA TTAAAGCGTG AATGTAGTTT GGAGCGTATC GTTTAATTTT TGGGGCGGTT 720 

TGTAGGCGGG TCGGGATTTT CGTCGGGCGG TCGGTGTGGG CGTGGGTGTG GGTGTCGGGG 780 

TGTTTTTTTC GTTTAATTTT ATTTCGTCGT TTAAAAAGTT TTTTTTTAGT AACGTGATCG 84 0 

CGTCGTTTAA GTTTTTTCGC GCGGTTTTTT TTATTTTTAA GTTTTGGATG GAGGATAACG 900 

TTTTTCGGAT CGATAATGGT AATAATTTGT TGTTATTTTA GGTAATATTT TGTTGTATTT 960 

ATATATTTTT TTTTTTTGTT TCGTTTTTTT TGTTATTTTT TTGATTTTTA ATTATTTATT 1020 

CGTTTATATT TAAAAAGGGT AGTAATGTTT AGTTTTTTTT TTTTTTTTCG AAGTTTTTAG 1080 

TTTTTTAGGG TTGTTTTATT ATTAGAGGAT GAGGTTGGGA GAATATTGTG ATTATTGGAG 1140 

GAATCGTATT CGTTTTTTTA GGGTAGAAGA AGTTTTTTTT TTTTAGTTTA TTTTTTTTTT 1200 

TATGGTGTTT GTATTTTTTA TTTTGATTTT TTTTGATAAG TAAAGTTGTA AGTGTGTGGT 12 60 

AAGGTGTCGG TATAGTTTTA GGATGAGTAG GTTGAGATTT TTATTATTTT GAGTAGTTAT 1320 

ATATTTTAGG TTATGTAATT TTGAGTTTAG GGTGTCGTTT GTAAGCGGTT TATATTTAAA 1380 

TTATTTTGAT TTTATTTTTA AAGAGGTTAA TAATTTTTGA GTGGTGTTAT TTTAGACGGT 14 4 0 

TGCGTATGTT TAGTTAAATT AATGTGAATA TATGTGTTTA TGTTTCGTTA AGGTGTTAGA 1500 

ATTATTAATA ATAATTAGTA TATTGTTTTT GTTGGGAAAA TTATGAGTGT GAGATTTTAA 1560 

TAAATATTTA TTATTGTGTA AGGGAAGGAG GTGGAAGAGT GGAAATTTTA AGGGTAATTT 1620 

TTTTTATGTT ATTTAGAAGA AGGATTTTTT TTTTTTTTTT CGGAGGTAAG AGATAATAGG 1680 

ACGTGATTTT TAGAGTTATA TTGTAATGGA GTTTATTTGT TAGTTAGTAT TGAAATATTT 174 0 

AAAGTTGTAG TGTTTTTTAT TAGTTGGGTT AAGAAAATAT AGATTAATTA TATTATTTGA 1800 

AATTGGGTAA AGTGAAAGTT TTGTAATTTT AATGAAAAAT GAGTTTTGTG TTTTGGTGTT 18 60 

AAATGTTAAT GAAAAATTTA GGATGTGTTT TAGATAAAAA GGTTGAAATG AAGAGTGTTT 1920 

TTATTTTTGT TTTTGTTTTT TGATTTAGTT TATAGTTATA GTAATTGGTA GTGTTTTGGG 1980 

TATTTTGGGT TGGAAAGGCG TAGTGCGGGT GTGTGTTTAT AGGCGGTTTT TGTTTT 2036 

ANGABEN ZU SEQ ID-NO: 13: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 452 Basen 
ART: Nukleinsaure 
ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES' MOLEK0LS : chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG : SEQ ID-NO: 13: 

AGTAGTAGTA GTAATTTTTT TGTATTTGTA GTAGAAAATT TATTTTAGAG ATTGGGTATG 60 

TGTGTTAAGG AGATGGTGAT TTTTTTTGGA TATTTTAGAG ATTTTTTTTT TTGTTATGAT 120 

TTTTATTCGG GGGATATTTA TATAATGTTA TTTTTTTTGA TTAGTTTTGT TTATATTAAG 180 

ATTGTTATTT TTTTAGTTGT TTGTGTGTTT TTAGATTATG ATATTTATTT AGTTGTTTAG 24 0 

TTTAGGAAAG ATTTTTGGGT GTATAAATTA GTTTAGAATA GTTGGTAGTA ATTTGTAGAT 300 

CGTTTGTTGT GTCGTGAGGG TATGGATGTG GTATATTTTA ATGGTTATAT TTATATTTTG 360 

GGGGGACGAG ATTTTATTAT TGGAGTTAAG TTGAAGGAAG TGGAATGTTA TAGTGTTTAG 4 20 
AGAAATTAGT GGGTATTGGT GGTTTTTGTT TT 



ANGABEN ZU SEQ ID-NO: 14: 

SEQUENZCHARAKTERI STIKA: 
LANGE: 513 Basen 
ART: Nukleinsaure 



452 
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ST RANG FORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 14: 



AGTAGTAGTA GTAGCGGAGA CGGAGGCGGC GGCGGAGGCG GCGGCGGCGA TTTTAGCGCG 60 

GGGCGAGCGG CGGGGTTTAT GGTCGGATTC GGCGAGTTGG TTTAATAGTG GGGTTAGGGG 120 

TTTCGGGCGC GGGGGGGATC GGAGGGAGCG AGGTCGTTGT CGGACGGGGC GGGGCGTCGG 180 

GAGGGGCGGG GTCGCGGTCG GACGGGGCGG GGTATTAGGA GGAACGGAGT GGGCGTTTGG 24 0 

CGGTTTTCGC GTTTAGATTG GGTCGCGGGC GTTTTTTGGT GGTCGCGGAG AGTTTAGGTG 300 

TTCGCGGTTG AGGGAGTTGG AGAGGGGTAA AATCGGGGTC GTAGCGGGAA GGCGGAAAGT 360 

TAGAGAGAGG AGGTGTTTCG GTAGCGGACG CGTTAGCGGG GTAGATAGGA AAATAGTTGG 4 20 

AAAGGGCGAT TTGGGGGAGT AGAGATACGA TTAGAGTTTG AGAAGGGTAG GAGTAAGGGA 48 0 

TGTTTAAGGG GTTTGGTGGT AGGTTTTTGT TTT 513 



AN GAB EN ZU SEQ ID-NO: 15: 



SEQUENZCHARAKTERISTIKA: 
LANGE: 980 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 15: 



AGTAGTAGTA GTATTTTCGG TTATAAGGAT TTTTCGAGTT TCGTTCGTCG GTCGCGGATT 60 

CGGTTTTTTT TTTTTCGGTC GTTAGGGGGC GGGTTCGGAT TATAGGATTG GAGTTGGGCG 120 

GAGATTTACG TTCGGAGCGG TTGTGAATTG GTAGGCGGTG GGCGCGGTTT TTGTGTCGTG 180 

TTTCGGGTAT TTAGTTTTTT AACGGGGTTT CGGAGTCGAA GATAGTTTTA GGGTTTAGGG 24 0 

AGCGCGGGCG GTTTTTGGGC GGCGTTAGAT TGCGGTGAGT TGGTCGGCGT GGGTTATTAA 300 

TTTAATGTAG TTTAGGGCGG CGGTACGAGA TAGAATAACG GCGAATAGGA GTAGGGAAAG 360 

CGTTTTCGAT AGGTTAGGTT TAGGGATTTG CGGGGAGAGG GCGAGGTTAA TATTCGGTAT 4 20 

GGGTTTTTGA TTGGTTTTTG GGATTCGTTT CGTTTACGTT TATAGGTGGG TTCGTATTTT 4 80 

TTTTTGCGTT TCGTTTTCGT TTTAATAGTT TATAGTTGTT GTTAGTTTAT TCGTACGTTT 54 0 

CGAATTTCGT TCGAATTCGT TATTGGTTGT TTTTTAGCGG TTTGTGTTGA TTGGTTGTTC 600 

GAAGATTCGT TTTTTTGTCG TGGGTTTAGT TTCGTAAATG CGTAGTTAAG CGGGTGGTAA 660 

GGGGCGGGTG GAGCGCGGGG CGCGACGGCG GAGGGGGGCG TGGGTAGTCG GACGTATTTT 720 

GGTAGGGAGT AGTAGGTGGC GGCGGTGTAT GGGGTTTGGT TTTATTAGCG GGTATTGGTT 780 

TATAGTTACG GTCGGGGGGT TATTTAGTTG GAGAGAGAAG GGATAGGTGA TTCGATCGGA 84 0 

GTTTAGTTTA GTTTTTAGCG GTGGGGCGAG AGATAGCGAG GGGAATCGAG GTTGGGGAGG 900 

TTATTTAGGG AGATTTCGGA GGGAATTTGG TGAGGTTTGA ACGGAGGGAG ATTTGGGGTT 960 

GAATAAAGGG TTTTTGTTTT 980 



ANGABEN ZU SEQ ID-NO: 16: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 223 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 16: 

AGTAGTAGTA GTAATATTAT TTTATTAAAA AAATATTAGC GTAGTTTTTA ATAGAGTTTT 60 

ATTTTTTAAA GTGAAGTTAA AAATAGGTTT TATGTTTAAA GTTTTTTTTC GTAGTAGGCG 120 

ATACGCGTAG ATGGAGAAAA TATTTTTATT GTTGGGAAAG GGAGGCGTGT TAACGGGGAC 180 
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GAAGGATATT TTATTATTTG GTAAAGTTAT TGGTTTTTGT TTT 
ANGABEN ZU SEQ ID-NO: 17: 

SEQUENZCHARAKTERISTIKA: 
LANGE : 114 5 Basen 
ART: Nukleinsaure 
ST RANG FORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKOLS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 17: 



223 



AGTAGTAGTA 

TTGTATTTAG 

TTTAGTTCGT 

TTTCGTTTAT 

AAGTTTTTTT 

TTGGGGCGGT 

AGCGATTCGT 

TTTATCGTTA 

ATTAGTTTTC 

CGTTTTTTGT 

GCGTTTGGAT 

GGGGAGGGGG 

GATAAGGGAT 

AGTTGTGTGT 

TTTATTTTGG 

GTGGTTTTTT 

GGTTACGAGG 

GAGGTTGTAG 

TTTAGTTGAG 

GTTTT 



GTTTTGGGTT 
GTTACGTTTT 
TTTTGGTTTA 
TTTTTTCGGT 
TTTGGCGATT 
TTGTAGTTTT 
TTTCGTCGTA 
GTATTATGTA 
GCGGGCGTCG 
TTTTAATTCG 
TGAGATTTGG 
TCGGGGATAA 
AGTTGTAATT 
TTCGAGTTTT 
TAGGGGATGT 
TGTTGGCGGG 
TTGAGTAGAA 
TCGGGGGTTA 
GAGTTCGTTT 



TCGTTTAGTC 
TTTAGATTCG 
GGTTTTTTTT 
TTTTTTTAGT 
AGGTTTTTTT 
ATCGTCGAGG 
TCGAATTCGT 
CGTTATAGTT 
TTTTAGTTAT 
GTGTGTGGTT 
AGGTTATATT 
GTTTATAAGT 
GAGTTCGGGG 
GGGGGTTTGA 
TGGAGTAGAT 
TTTAGTAGTT 
TGTTTTTATT 
TAAGGGTAGG 
TTTTTATATT 



GTAAGATGAG 
TTTTTTTTTA 
TGTTTTTTTC 
TTTGTTTTTC 
ATTATTTAGG 
AAGAGGAAGG 
AGTTTTATTA 
ATCGTTAGCG 
TACGGGTTCG 
AGGAGTCGAG 
AGGATTTGCG 
CGAGGGGCGG 
TGGAAGGGGT 
AATGTTTTTT 
GTCGTGGTTG 
GGTGGTCGTG 
TTGGAGGTTT 
ATGGGTTTAG 
TTTTTTTTGG 



TTAGTTGGGT 

TTAGATTACG 

GTTTTGAATT 

GGATTTTGGT 

GTTCGTTTTT 

CGTTCGTGGT 

TTATGTTTAT 

TGGTTGGGGA 

GTCGTAATCG 

TTTTATCGAT 

GTTATTGTCG 

GGTTCGTGGC 

GGGCGTTTCG 

GATATTTGGG 

TATTTTTGTT 

GAGAGTATTA 

CGTTTTATTT 

GTTTTTTTTA 

TATTTTTGTT 



TTGGTGGGGG 

TTTATCGTTT 

TTGTTTCGAG 

CGAGTATTTT 

GTTTGTTCGT 

TTGGTTTCGT 

TACGTCGATA 

GAGCGGGCGT 

GAAGTTTTTT 

CGGGAGTTAG 

TTATTAGGAC 

GGTTTCGGTC 

TTATGGGTTT 

CGGGCGGAGT 

ATAGGTTATT 

TGAGGACGTT 

TTATGTTATT 

TTTCGAGGTT 

TGAGGTTTTT 



ANGABEN ZU SEQ ID-NO: 18: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 633 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKOLS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 18: 



AGTAGTAGTA 
CGTGCGGACG 
GAGTTCGGAG 
GAGAGCGGTG 
CGCGGGAGTC 
TGTTTCGATA 
TTTTTATTTG 
TCGCGTTCGT 
TAGTTTAGGC 
GTAGTCGAGG 
AGTTGGTCGG 



GTATAGTTCG 
GGGGTTAAGA 
TTTGGAGGGG 
GTTTTTTTTT 
GTAGTTTTTT 
GGTGCGCGTC 
CGCGTTCGTT 
TTTCGGATAG 
GCGGAGGGAG 
TTGGTCGGGA 
GTAGGGTCGG 



GCGTTGGTTA 
GGTCGTTTTT 
TGGGGAGGTT 
CGGTTTTCGT 
TCGGGGGGCG 
GCGCGAAGGA 
TTATAAAGCG 
TTTTTGTTCG 
CGAGTTCGTT 
GAGGGTGAGT 
TGGTTTTTGT 



GCGGTTTAGA 
AGTTCGGGGT 
TCGCGTTTAG 
CGTTAGTCGA 
GATTCGGTTT 
ATGTAGTCGG 
TTGTTCGTTT 
TTCGCGCGTT 
TCGAGGTAGG 
GTTCGTTTTA 
TTT 



GTCGGGGTAG 
AGTTCGCGTA 
GGTCGGATCG 
TCGGGGCGTT 
CGGCGGCGGT 
TTTGATTTAT 
CGTTTTTATT 
GTAGTTTTAT 
TTTAGGACGG 
GTTGGGTAGT 



GGAGGGTTTT 
TTCGAGTTTG 
GAGGGAGAGG 
GGGCGGGCGT 
ATTTAGTTTT 
TAGCGTTTTT 
TTTTTAATTT 
TTTTTAGCGG 
GCGTATAGTA 
CGCGTAGGGG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1145 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
633 



ANGABEN ZU SEQ ID-NO: 19: 



SEQUENZCHARAKTERISTIKA: 
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LANGE: 12 Basen 

ART : Nukleinsaure 

ST RANG FORM : Einzelstrang 

TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel t e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 19: 

AGTAGTAGTA GT 12 

ANGABEN ZU SEQ ID-NO: 20: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 12 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 20: 

ACAAAAACTA AA 12 

ANGABEN ZU SEQ ID- NO: 21: 

SEQUENZCHARAKTERISTIKA : 
LANGE: 74 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE; linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 21: 

AGTAGTAGTA GTTTCGGTAG TTTAGTTTAT GGCGGCGGTG GCGGCGGTAG TAGGTTTGAG 60 
TTTTAGTTTT TGTT 74 

ANGABEN ZU SEQ ID-NO: 22: 

SEQUENZCHARAKTERI STI KA : 
LANGE: 103 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 22: 

AGTAGTAGTA GTAGCGGTAG CGGTAATAGG GCGGTTGAGA ATTCGGCGGC GGCGTTTTTT 60 
TTCGTTTTTT TTTTTTTCGT TTCGTCGATT TTTAGTTTTT GTT 103 

ANGABEN ZU SEQ ID-NO: 23: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 55 9 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 
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ART DES MOLEKOLS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 23: 

™_™I A GTAAGAAGGA AAAAAATAAA TTTTTTAAGT ATTTAGTGTA GTTTTTTTTG 60 

r^III™ TTTTATTTCG GTATAGTTAG GGTTTTTAAT TTATTTTTGT TTTGGGTTTA 120 

GGGAAAATAA AAAGTTAAGT TTATTCGTAT TTAGTTAAAA GTTGAAAATA ACTCCTCCC* Van 

TTAATTTTTG GTTTTAAATA AATTATTTGA TGGTGlJS AGGtSJX SSSSS 2 0 
TTTTTTAGAT AAGGGTTTAT TTTACGAGAT TATTAAGTAT TGTTTCGTGA GATTATTGAA 

ATAATAGTAT TTTTTTTTTT ATCGAGGATT ATAGTATGTT TTTGATTTAA S5S?j£ 360 

GTTTTTGAAG AGATATTTGG GAGTTTTTAG AAATTAAAGG AAGGATTGGA AAtSIgOT 420 

GGTGAGGGGC GTTAAATAAT TTTGATTTTT ATGGTTGTGA TTGATGTTGT TATTAGATTA tlo 

TTTTTATATT TAATAATATT GAATTATTTA AACGGATTAG TATAAATTAA mSJgmm 5AQ 

TATATTTTTA GTTTTTGTT ftHHibaiAb 540 



ANGABEN ZU SEQ ID-NO:24: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 1695 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKOLS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 24 : 



TTATTAGTTT TTGTT 
ANGABEN ZU SEQ ID-NO: 25: 



559 



I TTATATATTG 


60 


GTGGAGGGGA 


120 


GATGGTTAGC 


180 


GACGGCGGGG 


240 


GGTTTCGCGT 


300 


CGCGGGATTC 


360 


TCGGGGTTCG 


420 


AGGAAGTTAA 


480 


GGAGAAGTGT 


540 


TTNNNNTTNT 


600 


GCGTCGGTCG 


660 


GTCGAGATTT 


720 


AAGAAGAAAG 


780 


CGTCGCGTCG 


840 


TACGAAAAAA 


900 


GGGCGGGTTT 


960 


CGCGTGTTTT 


1020 


AGTCGGTCGT 


1080 


TGACGTCGCG 


1140 


AGGTTGGGAG 


1200 


CGCGAGTGTT 


1260 


AGTAGAGGAG 


1320 


AATTTAAGTT 


1380 


TAT TAT AG AA 


1440 


TATTTGTAAT 


1500 


AAGTTGGTCG 


1560 


TTATTCGTAG 


1620 


TTGGCGGAGT 


1680 




1695 



SEQUENZCHARAKTERISTIKA : 
LANGE: 722 Basen 
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ART : Nukleinsaure 

ST RANG FORM : Einzelstrang 

TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 25: 

AGTAGTAGTA GTTTCGTTAC GAATACGATT AGTTTATATT GGTTGTTTAG TATTTCGGTT 60 

AGTTTTTGTG GGACGTTGGC GCGTATATCG TTTCGTCGGG GGGTCGGGGA TTTCGGGGAT 120 

TTCGGGGTCG AGGACGAGGG AGGCGAGTAG GTCGTTGGTT TCGACGATTT TGCGATCGAG 180 

GCGTTTGTAG TTGTTCGGGG CGAGGCGGGC GATTTTAGGT TTTCGAGTAT TTTCGAGATA 24 0 

TTCGCGTTAA GTTTGGTTTC GGGGGTGGTT GTCGTCGGGT TTCGTTTGCG TTTTTGGTTT 300 

TTGTTTTTGT TTCGACGTTT TTGTTAATTA GTATTTTTTT . TTTTAATTTT TTTTCGATTT .360 

TTATTTTACG TTTTTGTTAA TTTGTTTTTT TTTTTGTTAT TTTTCGACGT TCGTTTTTTT 4 20 

TTTTTTTGTT TTTTCGTTTT TCGTTAAGGT ATTATTTTGT TTATTTATTT AGCGTTTTAT 480 

TTTGTTGATT TGGGATTTTA CGAGTTTTTT TGTTCGTTGT TTTTTATTGG GTAACGTTCG 54 0 

GGGTAGTTAT TTGTTTTTTT CGGGATTTAC GCGGATAGTT TTTCGTTTTT GATTTTTGGG 600 

ATATTGGTTA GTTTTGTCGC GATATTAGCG CGTNTTTTCG TATTTTCGTT CGCGCGTTCG 660 

GTTTTCGTTC GTCGTTTGTA GTTTTTATTT TTGAGTCGAC GTTCGTTTAT TTAGTTTTTG 720 

TT 722 

ANGABEN ZU SEQ ID-NO: 26: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 517 Basen 
ART: Nukleinsaure 
ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 26: 

AGTAGTAGTA GTTCGAATTC GCGCGCGTAG CGGCGTATGG TTAGGTTTAG CGAACGTAGT 60 

TTTAGCGAGT GGCGCGTTAG GCGTATTACG TAGAGTACGC GTAGCGTACG TAGTAGTCGT 120 

AGTATTAGTT TCGCGCGTTT TAGGAGTTTG GTTTCGTTCG GGTTTGTCGT TAGTTTTAGT 180 

AGTAGCGATA CGTAGAACGG TAGGAGCGTT AGGATGTTAA TGATGTTGAG TGGCGCGCGT 24 0 

AGGAAGGCGT ATTTGTTTTC GGTTTGTAGG GAGCGTAGTA GGAATTCGAA GGAGAATTAG 300 

GTTACGTATA CGGTTTTTAG TACGAATAGG TTGCGGTATT TGGGGGAGTA TTCGTTTTGC 360 

GGGGAGAGGG GATACGGGGT TGGGGGCGTA GGTTTTTTGG AGGGTCGGGG GCGTTTTGTT 420 

TTTTTTTTTT TAGGATTAGA GGCGTTTTTT AGGTTATTTT TTTCGTTTTA ATTTACGGAA 4 80 

GCGGGTGTAG GGGATATTGA TAGGTTTAGT TTTTGTT 517 

ANGABEN ZU SEQ ID-NO: 27: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 1078 Basen 
ART: Nukleinsaure 
ST RANG FORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 27: 

AGTAGTAGTA GTATTAGTAA TAGTAGTACG AAAAGTAAAA TTGTAATTTA AACGGTTTTT 60 

AGGGTTTAAG TAGGTTCGAC GAAGATTCGT TTATTCGGTC GTTAGAAAAT TGGGAGTTTC 120 

GTTCGTTTTT TCGGTATTGA AACGCGATCG GTTTTGTTTG GTATCGTATT TTTTTTTTGA 180 

TTTTATTTAT ATTACGACGA CGGACGTTCG AGAACGTTGT ATCGCGTTTC GTAGGAAGTG 240 

TTTTTTTGGG CGGAAGTTTT TGAGCGTGAT ATAGCGGAAG TGTTTTTTTT TTCGGTTTTT 300 

TTGGTTTCGG TCGTAGAAGC GAGATGGTGA GTTGTGATTG TGGTGTTTGT GAATCGCGTT 360 
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TTATTTTCGT 
TAAGGGGAAT 
TTGTTAATTG 
GTTTTTTGTT 
GAGGGAAGGA 
TTTTTTGGTC 
GGTTTTAGGT 
TTTTTTCGTA 
GAGAATTCGA 
AGACGAAGGG 
GTTGTGGTTT 
TTAAGCGTAA 



TTTTTGTGTT 
TGGTGGGTTG 
GTGTTTGGGG 
TCGGTTTAAT 
GTTTGGGAAT 
GGAGTTTGTA 
AACGTGAAAT 
GTTTCGATTT 
GTAAATTTAG 
AACGTTATCG 
TAAGGTTTAT 
GAGAAAGTGT 



TTTTTGTTTG 
GAAAGAGGTA 
GATTTATTTC 
TTTTGGAGAT 
GTTTGGTTTT 
AAGATAAGGT 
GCGGGTAGTG 
TTACGATTGT 
AAGTTGTTAG 
TTTGGAAAGC 
TATTTTTAGA 
AAGTAATATT 



TTGTGTTTGG 
TGCGGTGGTT 
GTCGTAATTG 
TTTTTACGGT 
GTGTAATAAT 
GTATTTTAGA 
GTTTTTGATT 
TTTTAAATTT 
GTTTTAGAAT 
GTCGTAATAA 
AGTCGATTTG 
TTTTAGGTTA 



GGGGTTGGTA 
TTTAAGAGTT 
TGGTGTTAGA 
TTTAGTTTTG 
GAAATAATTT 
ATATTGTAAT 
TGGTATTCGT 
TATTAGTAAT 
TATTTATTTT 
GACGTATACG 
TGGTAAATGT 
ATTGTGTTAG 



AGATTTCGGA 
AGAAGAATGA 
GTCGTATTGT 
GTTGGGAGTC 
ATTGGTGATG 
TTTTGCGGAG 
GGAAAGAGGT 
TGGTTTTTCG 
TTTAATGTGT 
TTGTGTCGTC 
GGTTATTTTG 
TTTTTGTT 



ANGABEN ZU SEQ ID-NO: 28: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 294 9 Basen 
ART: Nukleinsaure 
ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKOLS : chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 28: 



AGTAGTAGTA 
TCGTGGTTAT 
GTTTTAGCGG 
CGCGGGTTTT 
TTTCGTTTAT 
TTTTTTTTAG 
TTTTTTTTTT 
AAATTTTTTC 
GTTGGTTTTT 
ATTTTTTGCG 
AAATAAGAGT 
TTTGGGTAGA 
TGTCGAATCG 
AGTAGTTGTT 
GTGTATATAG 
GTAGAGTGTA 
GTTCGTTTTG 
TTTTTTTTTT 
TTTTTTTTTT 
TATTATATTT 
TTGGGTGATT 
TTCGATTGGT 
TTAGTTTTTT 
TATATTTTAA 
CGTAATAGGT 
GGGAAGAGAA 
TATTTAGTAC 
CGCGCGGTAC 
TTAAAGTTTT 
CGGGGGTTCG 
TAATTTTTCG 
ATTATTTGGG 
TCGTGTCGTC 
TTTTTTTTTT 
GGGTGTCGGT 
ATAGAGTTAT 
TTCGGTCGAA 



GTCGTAGGAG 
TTTTTTTAAN 
GGTTCGTCGG 
CGTTTTTTTT 
TTGTTAAGTG 
TTAAATTACG 
TTTTTTTTTT 
GTTTTTGAAG 
GTTTTTTTTT 
ATGGTGTATT 
TTTTTTTTAT 
AATTAGGAAA 
TTTTGTTATT 
TGGAGAAGGA 
GGGATCGATT 
TCGACGGCGG 
CGTTTTCGTT 
TTTTTTTTCG 
TAGAGCGGGG 
TTTTAAATAT 
GGTAGGTTCG 
TGTTTTTTAA 
TTTTTTTTAT 
TTTTTAGTGT 
TTGGGCGGGG 
TTAGAAGGAA 
GCGTCGGGTT 
GGATGTATTA 
TTTTTTTTTT 
TATCGTTAAG 
TAGTCGTTGC 
AAATTTGTAG 
GTTTTTTGGT 
TTTTTTTTTG 
TAGCGGAGTC 
CGTAAGTGTA 
AGAACGGGGA 



TAGCGTTTTG 
GGGGGTCGTG 
GCGGGGCGGG 
TTTGTTTTCG 
AAGGTTTTAC 
GATGATTAGT 
TTTTAGGAAT 
GCGTGGTGTT 
TTTGGTTTTT 
TTTTTGAAGT 
TTTTTTCGTA 
TAAATATAAT 
TTGTTGTTGA 
GGAGGAAGAA 
TTTGATATAT 
GCGTTGGCGT 
CGCGTTTTTT 
GGCGTTCGTT 
ATTGTCGAAT 
AAGGAAGTCG 
GAATGATTGG 
TTTAGGTAGA 
TATTTTTTTT 
TCGGTTTAGA 
GGAAGAAAGG 
AACGAAGGGG 
GTTTATTTTT 
TTTAAGTTAA 
TATTAGTCGG 
AGTTTTGGTC 
GCGTCGGCGG 
TTTAGGANNT 
TTTTTTATTT 
GGATTCGTGT 
GTGCGATGTA 
TTCGATTTTA 
TCGGTTATTC 



GGGAGGGGGG 
GTCGTTTTTT 
GATTTGTATT 
GGCGAGTTCG 
GGGAGATAAT 
AATCGGTTCG 
ATATTTTATT 
GTTGGTTGTT 
TCGTTTTAAG 
TGTTATTGTC 
ATAGTTATAG 
AAGGAAAAAA 
CGGTTGGGGT 
GAGTGTATTG 
AATAATTTTA 
TGGTCGTGTT 
TTTTTTTTTT 
TTCGTTTCGA 
GTTTATTTTT 
AGTATTAGGG 
TTTAGGACGC 
GCGTCGTAGA 
TTTTCGTTTT 
CGTTGGCGTT 
GGAGATAAAA 
GAAATATGAA 
TTATTTTCGT 
TATTTATAGA 
TTTTTTTTTT 
GTGGTTACGT 
TAGTTTTTTT 
TCGGTGTTCG 
TTTTTTTTTT 
AAGTAGCGTG 
TTTGAAAAGT 
ATGGTTTTAG 
GCGTTTTTTT 



TTCGTTTTTC 
AGTTTCGGCG 
CGGGGCGTTT 
GATTTTGTTC 
AAAGAAAGAA 
TTTTTTTTTT 
CGTTTTTTTT 
CGCGAGTGCG 
TTTTGTTTTG 
GGAGTTTTTG 
TTTGATGCGA 
T TG AATAGGA 
TGGTGTTTTA 
GTGGAGGTGG 
GTGGGTACGT 
GGAGTAGAGT 
TATTTTTTTT 
TTTGATAGTT 
CGTCGCGAGC 
TTTTCGTTGA 
GAGGTTTTTT 
AGTTGGAAAT 
TTTTTCGTCG 
TTTTCGGCGG 
GGGAGGGAGG 
AAATAGTAAT 
TTCGTTAGAG 
TAGATGTGTT 
TGATCGGCGG 
TTTTTGGAAA 
TGTTTAAGTT 
CGCGTGCGAG 
TTTTTCGTTT 
CGTGTTTTTG 
AATTAGTTCG 
AAATTTTTGT 
TTGTTTTATC 



GGGGTGCGTT 
CGTTGGGTTC 
TTTCGGGACG 
GGTCGCGGGG 
GTTGTTTTTT 
TGTTCGTTTT 
T AG AG TAG T A 
GAGAGGGGAG 
TTTTAGGAAA 
GTTGTTTTTG 
TATTTTTTTT 
AAAAAAATGA 
TTTTTTTTTT 
AGGTGTGTGT 
TGTACGGTTC 
TGTAGTAGGA 
TTTTTTTTTT 
CGTTTTTTGT 
GCGTATTTAT 
TTGGTTATCG 
TTTCGGTCGT 
TTGTCGTTTT 
TTTTTTTCGT 
TTTTGGCGTT 
GACGAGAGGG 
TTGTTTATTT 
ATTTGTAAAG 
TTTAGTGGTT 
GGGTGGGAAG 
TTCGTTATCG 
TTCGGATGTT 
ACGGATCGTT 
TTTTTTTTTT 
TGAGTTTGGA 
ATTTTTTTTT 
GGTATTAGGA 
GTTTTTTCGT 



420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1078 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040. 
2100 
2160 
2220 
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GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGTGATTAG CGGTGGGGGG GTTTGTTCGT 2280 

TTTTTATTTT TAGGTATGGT GGTGTTTTTT TTTTTTTTTT TTTTGTTTTA GATGGATTTG 2340 

CGTGGTGGAT GGGGTTGGCG GCGATAAATG TTTTTTTAGT TTTAATTTAG TTGAAAGAGT 24 00 

TAAGGGGGAT GGGAGGGGGA GTGTATTCGG TAGGCGAGAG AAGCGGGGGT GGGGTGGGGT 2 4 60 

GGGGTGGGGG GACGCGGTTA AGCGGAAACG TTGTATAGAG GAATTTTAGC GAATTAAGAA 2520 

AAAAGAGAAA GTGGTAACGA AAATAAGGGT AAATTGAGTT TTTTTCGGGG ATTTTTAATG 2580 

AATTAATTTA ATTCGGATAT TTAATAAATA TATGGTTTTT AATGAGCGTG CGTGTGCGTG 264 0 

TATTTCGTAT TTTTAGTTGC GGGTGCGTTC GTTTGCGTTC GTCGTTTTTA GTTAGAGTTT 2700 

GTATTTGGTA GTTTCGAGTT CGAGCGGTAG TTTAGGACGT AGTCGAGGAG CGTCGTCGGT 27 60 

GCGTTTCGAT TAAAATGTGA ACGGGTTTGT TTTTTTTTTT CGTTGTATCG TGTTTTTGTC 2820 

GAGCGTAGTT AAGTGAATTT AGTGAAAGTA GGAGTTTTTT TGTTTAGTCG TAGTTAGGTA 2880 

GTTTTCGCGT GATTTTAAGA TTAATATTAG ACGCGTAGAA TTTATGTAGG TTTTTGTTTA 2 94 0 

GTTTTTGTT 294 9 

AN GAB EN ZU SEQ ID-NO: 29: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 117 Basen 
ART: Nukleinsaure 
ST RANG FORM: Einzelstr'ang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 29: 

AG TAG TAG T A GTTTATTTTG GGTTGATATA AAATTGAAAA ATTTATTTGT TTTTTTATTT 60 
TTTTGGGTTG GATTCGGTGT ATCGGTTGAT ATATTTTTTT GGTTATTAGT TTTTGTT 117 

ANGABEN ZU SEQ ID-NO: 30: 

SEQUENZCHARAKTERI STIKA : 
LANGE: 639 Basen 
ART: Nukleinsaure 
ST RANG FORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 30: 

AGTAGTAGTA GTATTATGGT TATTTCGACG GTCGCGTTCG TTATTTTTTT GCGGCGGTTT 60 

AGTCGCGACG TTGTTAGGGT TAGTAAATTT TTTTTATTTT TGGGCGTAAT GGTTGTCGGG 120 

GTCGGGGTTT TTCGCGGGTT AGGAGGCGGT GATTCGTTTT GGGTTTGGGT TTGTATTTTT 180 

TCGACGGTTG TTTTTCGTTT TTTTTATTTT GTTTTTGCGG GTTTTAGTCG CGGCGGTGTC 24 0 

GTTTTTTAAG TCGTTCGTTA AGGGGAGGTT TTTCGTGGGT TACGTTAGGG GTAGTTTTCG 300 

ACGGTTTAGA GTTAGTGGTT TTTTAGTATT TTTTCGTTTA GTTTTAACGA TTTTGGGTAT 360 

TTGAGATTCG CGGTTTTTCG GACGGTTGGT TTTTTAGGGA TTTGAGATGT TTGTTTTTTA 420 

GATTGTTGTT TTTTTAGGGA TGGCGCGGTG TTTGGGTTTT AGATTGTTTA GATAGATTAT 480 

TTTTTGATGG AGAGGGGATT GTTTTTCGCG TTTCGGACGT TTCGGGTTTT GAGTTGCGGG 54 0 

TGTTGTTTAT CGGGCGCGAT TTTTTAGTAG GTTTTGCGTT TTGTTTTTTG GTAAGTATCG 600 

ATTTATTTTG TTATTTTTGT CGCGGTTTTA GTTTTTGTT 639 

ANGABEN ZU SEQ ID-NO: 31: 

SEQUENZCHARAKTERISTIKA: . 
LANGE: 304 Basen 
ART: Nukleinsaure 
ST RANG FORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS : chemisch vorbehandelte Genom-DNA 
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SEQUENZBESCHREIBUNG : SEQ ID-NO: 31: 

AGTAGTAGTA GTATAGTTCG GCGTTGGTTA GCGGTTTAGA GTCGGGGTAG GGArrrTTTT fin 

CGTGCGGACG GGGGTTAAGA GGTCGTTTTT AGTTCGGGGT AGTTCGCGTA TTCGAGTTTG 120 

GAGTTCGGAG TTTGGAGGGG TGGGGAGGTT TCGCGTTTAG GGTCGGATCG GAGGCACArr ■ \ln 

GAGAGCGGTG GTTTTTTTTT CGGTTTTCGT CGTTAGTCGA TCGGGGCCTT GGGCGGgS l*n 

CGCGGGAGTC GTAGTTTTTT TCGGGGGGCG GATTCGgSS CGGCGGCGgJ SSSSS 300 
TGTT 

304 



